skariko

skariko

Google ha ora l’esclusiva su tutti i contenuti di Reddit che non potranno più essere indicizzati da altri motori di ricerca e chatbot. Mi sembra un bel colpo per Google e uno decisamente brutto per gli altri motori di ricerca visto che:

su Reddit si trova una quantità enorme di informazioni/soluzioni a problemi di qualunque tipo (ed ecco perché non è una buona idea lasciare tutto questo potere/sapere a una singola società privata)
la ricerca interna di Reddit è terribile

Traduzione da The Verge

Reddit sta aumentando il suo giro di vite sui web crawler. Nelle ultime settimane, Reddit ha iniziato a bloccare i motori di ricerca dalla visualizzazione di post e commenti recenti, a meno che il motore di ricerca non paghi, secondo quanto riportato da 404 Media.

Al momento, Google è l’unico motore di ricerca mainstream che mostra risultati recenti quando si cercano post su Reddit usando il trucco “site:reddit.com”, riporta 404 Media. Questo esclude Bing, DuckDuckGo e altre alternative, probabilmente perché Google ha concluso un accordo da 60 milioni di dollari che le consente di addestrare i suoi modelli di intelligenza artificiale sui contenuti di Reddit.

“Questo non è assolutamente legato alla nostra recente partnership con Google”, ha dichiarato il portavoce di Reddit Tim Rathschmidt in una dichiarazione a The Verge. “Abbiamo discusso con diversi motori di ricerca. Non siamo stati in grado di raggiungere accordi con tutti loro, poiché alcuni non sono in grado o non sono disposti a fare promesse esecutive per quanto riguarda l’uso dei contenuti di Reddit, compreso l’uso per l’IA”.

Il mese scorso, per far rispettare la sua politica contro lo scraping, Reddit ha aggiornato il file robots.txt del sito, che indica ai web crawler se possono accedere a un sito. “È un segnale per coloro che non hanno un accordo con noi che non dovrebbero accedere ai dati di Reddit”, ha dichiarato Ben Lee, responsabile legale di Reddit, al collega Alex Heath di Command Line.

In una dichiarazione rilasciata a The Verge, la portavoce di Microsoft Caitlin Roulston ha affermato: “Microsoft rispetta lo standard robots.txt e onoriamo le indicazioni fornite dai siti web che non vogliono che i contenuti delle loro pagine siano utilizzati con i nostri modelli di intelligenza artificiale generativa”, aggiungendo che Bing ha smesso di effettuare il crawling di Reddit quando la piattaforma ha aggiornato il suo file robots.txt il 1° luglio.

Continua su The Verge

Ecco finalmente la comunità italiana Lemmy dedicata all’informatica!

Questo è il luogo in cui condividere post sul mondo dell’informatica: notizie su hardware e software, cybersecurity, cyberwarfare, hacking, nuovi prodotti, data breach!

Ricordiamo che esistono anche alcune comunità che si occupano di argomenti più specifici, quali:

Le Alternative, dedicata alle alternative open source ai prodotti più diffusi

Etica Digitale, dedicata alle implicazioni etiche della tecnologia

Pirati Europei, dedicata al mondo dei pirati italiani ed europei

Che succede nel Fediverso, dedicata alle notizie sul fediverso

Devol, con le notizie sulle istanze del fediverso e i servizi di decentralizzazione del collettivo Devol

Lavoratori Tech, dedicata al tema del lavoro tecnologico

Videogiochi, dedicata al gaming

Retrogaming, per i videogiochi vintage

GNU/Linux Italia, dedicata nello specifico al mondo del pinguino

Regole della comunità:

🏳️‍🌈 chiediamo educazione e rispetto per gli altri

🎃 anche se ci chiamiamo “Informatica” non banniamo gli utenti a caso 😁

🚫 trolling, shitposting e molestie sono vietati

💲 è vietato superare il confine che separa l’informazione dalla pubblicità

🔊 evitiamo il clickbait e il sensazionalismo

📖 per il resto valgono le regole dell’istanza al link https://feddit.it/post/6

Reddit ora blocca tutti i motori di ricerca (a parte Google)

Reddit ora blocca tutti i motori di ricerca (a parte Google)

Reddit is now blocking major search engines and AI bots — except the ones that pay