Cuprins:
Definiție - Ce înseamnă Scraping Content?
Răzuirea conținutului este o modalitate ilegală de a fura conținut original de pe un site web legitim și de a posta conținutul furat pe un alt site, fără cunoștința sau permisiunea proprietarului conținutului. Răzuitorii de conținut încearcă adesea să transmită conținutul furat ca fiind propriu și nu reușesc să ofere atribuirea proprietarilor conținutului.
Răzuirea conținutului poate fi realizată prin copiere și lipire manuală sau poate utiliza tehnici mai sofisticate, cum ar fi utilizarea de software special, programare HTTP sau analizoare HTML sau DOM.
O mare parte din conținutul care este pradă de răzuire este material protejat de drepturi de autor; Repostarea acestuia fără permisiunea proprietarului dreptului de autor este o infracțiune pedepsibilă. Cu toate acestea, site-urile de răzuire sunt găzduite în întreaga lume, iar răzuitorii cărora li se cere să elimine conținut protejat de drepturi de autor pot schimba doar domeniile sau pot dispărea.
Techopedia explică Scraping Content
Scraper-urile de conținut sunt capabile să conducă traficul către site-urile lor web prin răzuirea de conținut de înaltă calitate, cu cuvinte cheie, dens din alte site-uri. Bloggerii sunt deosebit de susceptibili la acest lucru, probabil deoarece bloggerii individuali sunt puțin probabil să lanseze un atac legal împotriva răzuitorilor. Răzuitorii sunt încurajați să continue această practică, deoarece motoarele de căutare nu au găsit încă o modalitate eficientă de a filtra conținutul unic din conținut razuit, permițând răzuitorilor să beneficieze în continuare.
Administratorii site-urilor web se pot proteja împotriva răzuirii prin măsuri simple, cum ar fi adăugarea de link-uri către propriul site în cadrul conținutului. Acest lucru le va permite cel puțin să obțină un pic de trafic din conținut razuit. Metodele mai sofisticate de tratare a răzuirii de către roboți includ:
- Aplicații anti-bot comerciale
- Prinderea de roboți cu o potă de miere și blocarea adreselor IP ale acestora
- Blocarea robotilor cu cod JavaScript