Sebbene il termine evochi l’immagine di ingegneri che lavorano in tute bianche da “coniglietto” in una pubblicità dell’Intel Pentium degli anni '90, le “camere bianche di dati” per i dati non sono strutture vere e proprie, ma piuttosto un particolare schema di condivisione dei dati tra server.

L’Interactive Advertising Bureau (IAB), un gruppo leader del settore pubblicitario, definisce una “data clean room” come “un ambiente di collaborazione sicuro che consente a due o più partecipanti di sfruttare le risorse di dati per usi specifici e concordati, garantendo al contempo l’applicazione di rigorose limitazioni di accesso ai dati”.

L’obiettivo è garantire che i dati personali dei clienti non trapelino dalla prima parte (l’azienda che ha un rapporto diretto con il consumatore) alla terza parte (l’azienda che cerca di accedere ai dati dei clienti per ottenere informazioni) o a qualsiasi altra parte. Proteggendo i dati della prima parte e consentendo al contempo un accesso controllato, una “camera bianca di dati” consente teoricamente alle terze parti di accedere in modo sicuro ai dati per creare segmenti di pubblico per la pubblicità, identificare clienti sovrapposti in più set di dati, eseguire l’arricchimento dei dati con altri set di dati e ricavare approfondimenti, il tutto senza avere accesso diretto ai dati personali stessi.

Ma le implementazioni di queste “camere bianche di dati” sono numerose e non esiste un vero e proprio standard. All’inizio di quest’anno, lo IAB ha pubblicato una guida alle migliori pratiche per lavorare con le camere bianche. La guida descrive alcune delle caratteristiche che si possono trovare in un’implementazione di una camera bianca per i dati, tra cui la possibilità di limitare i tipi di query e il livello di dettaglio disponibili per le terze parti, nonché gli utenti che hanno accesso alle informazioni e per quanto tempo. Per proteggere ulteriormente la privacy, possono essere impiegate diverse “tecnologie di miglioramento della privacy”, come la crittografia in doppio cieco dei dati e l’aggiunta di “rumore” statistico ai risultati delle query per impedire la reidentificazione delle persone.