Dedicato agli admin: una trappola per scraper LLM
Genera pagine web infinite alimentando gli scraper di merda nonsense.
Avveleniamo i pozzi, ma selettivamente!
https://hackaday.com/2025/01/23/trap-naughty-web-crawlers-in-digestive-juices-with-nepenthes/
@paoloredaelli
Basandosi sul comportamento: se i crawler seguono quanto indicato da robots.txt, non cercando di accedere in parti del sito non consentite, non finiscono nella trappola infinita, altrimenti sì.
EDIT: mi sbagliavo un warning avvisa proprio che non c’è modo di distiguere buoni da cattivi
@informatica
https://zadzmo.org/code/nepenthes/
@lgsp
Mi fatto stanno “avvelenando i pozzi”.
@informatica