Il fenomeno del cd. webscraping è una tecnica informatica attraverso la quale è possibile estrarre dati da un sito web per mezzo di programmi software. La sua sempre maggior diffusione è direttamente correlata alle esigenze dei sistemi di intelligenza artificiale di acquisire dati per i propri processi di apprendimento; ciò porta alla ricerca e raccolta massiva di dati anche di natura personale.
Con il provvedimento del 21 dicembre 2023 il Garante per la protezione dei dati personali ha aperto un’indagine conoscitiva sulla raccolta di dati personali online finalizzata ad addestrare gli algoritmi di intelligenza artificiale.
L’obbiettivo del Garante è verificare che siano state adottate adeguate misure di sicurezza da parte dei siti che mettono a disposizione i dati trattati a produttori di algoritmi di intelligenza artificiale, i c.d. “spider”, siano essi siti pubblici o privati, stabiliti in Italia o che offrano servizi in Italia.
A decorrere dunque dal 18 gennaio 2024 il Garante ha avviato un periodo di 60 giorni di tempo per la consultazione pubblica, affinché tutti i soggetti interessati, in particolare le associazioni di categoria, le associazioni di consumatori, gli esperti ed i rappresentanti del mondo accademico possano inviare i propri contributi all’Autorità (doc-web n. 9974546).
L’obiettivo dichiarato è raccogliere contributi e commenti sulle misure di sicurezza adottate e adottabili contro la raccolta massiva di dati personali a fini di addestramento degli algoritmi di intelligenza artificiale; alla conclusione del periodo di raccolta dei contributi, ci si attende un provvedimento che avrà, direttamente o indirettamente, efficacia vincolante nei confronti dei succitati spider; non è da escludersi l’adozione di prescrizioni destinate ai titolari e responsabili del trattamento affinché custodiscano con specifiche misure di sicurezza, che assumiamo il Garante stia oggi valutando, i dati personali potenzialmente esposti a rischio webscraping.