Il Manifesto: Facebook e big data, quando non paghi qualcosa il prodotto sei tu

Facebook e big data, quando non paghi qualcosa il prodotto sei tu

Hacker’s dictionary. La rubrica settimanale a cura di Arturo Di Corinto

ARTURO DI CORINTO PER IL MANIFESTO DEL 22 MARZO 2018

Vediamo come funziona il data mining politico-elettorale di Cambridge Analytica.

D come data mining. Per Wikipedia il data mining «è l’insieme di tecniche e metodologie che hanno per oggetto l’estrazione di un’informazione o di una conoscenza a partire da grandi quantità di dati».

Il processo avviene attraverso metodi automatici o semi-automatici. E aggiunge che con data mining «si intende anche l’utilizzo scientifico, industriale o operativo di questa informazione».

Perciò grazie Wikipedia, e non dimenticate di fare una donazione all’enciclopedia libera che tutti usano senza dirlo per le sue belle e sintetiche definizioni.

Nell’epoca di Facebook e dei «Big Data», il data mining è cruciale per individuare la propensione all’acquisto dei consumatori, ma anche per definirne il profilo politico, sessuale, religioso. Perfino il rischio sanitario o creditizio.

I dati, provenienti dalle fonte più disparate, come l’uso di app, computer e smartphone, carta degli sconti, tessere elettroniche e per la pay-tv, vengono raccolti in grandi database e, incrociati fra di loro, possono essere usati per costruire profili singoli e aggregati, individuali e collettivi di consumatori, lavoratori o elettori.

Questi dati, shakerati con i metodi della statistica e delle scienze sociali grazie a sistemi automatizzati, definiscono la nostra «data-immagine». Che è il profilo digitale della nostra persona, quello che ci precede quando andiamo a chiedere un mutuo in banca o cerchiamo di contrattare con l’assicurazione.

Però mentre prima questi dati andavano raccolti e con fatica da fonti diverse, oggi basta usare quelli accumulati da social network come Facebook per fare una profilazione completa degli individui ed essere in grado di offrire al consumatore quello che è più propenso a desiderare.

Per capire come questo accade, la società Data X, di base a New York, ha creato un add-on, un’estensione per Mozilla Firefox o Chrome, che si chiama Data Selfie. Scaricata e installata sul nostro computer ci permette di vedere quanto tempo passiamo a leggere i post dei nostri amici, quanti like produciamo, quanti link clicchiamo e che cosa digitiamo o cancelliamo dai post di Facebook.

Dopo avere interagito un poco sulla piattaforma avremo un quadro preciso e dettagliato del tipo di dati che sono in possesso di Facebook e potremo capire perché sia al centro dello scandalo di Cambridge Analityca, accusata di aver contribuito a manipolare il voto della Brexit e quello per Trump proprio grazie a un uso spregiudicato dei dati degli utenti di Zuckerberg.

Ma Data Selfie fa di più: usando degli algoritmi matematici impilati in un software dall’Università di Cambridge è in grado di generare un profilo psicologico dettagliato dell’utente legato a età, genere, preferenze sessuali, intelligenza, ma anche soddisfazione per la vita, orientamento politico e religioso.

Per farlo usa anche alcuni strumenti di IBM Watson, l’intelligenza artificiale di IBM, che è in grado di identificare emozioni, propensioni sociali e stili di vita dei soggetti di cui elabora i dati.

È proprio quello che faceva Cambridge Analityca a giudicare dal rapporto creato da Michael Phillips, suo impiegato esperto di «Big Data»: con poche righe di codice reso pubblico sul sito GitHub, Phillips era in grado di geolocalizzare gli elettori e poi attraverso gli hashtag usati, i link cliccati e le conversazioni intrattenute, ricavarne il «sentiment», cioè l’inclinazione emotiva e cognitiva verso temi elettorali per poi cucirgli addosso un messaggio politico che “non erano in grado di rifiutare”.

Cookie	Durata	Descrizione
connect.sid	1 hour	This cookie is used for authentication and for secure log-in. It registers the log-in information.
viewed_cookie_policy	1 year	The cookie is set by the GDPR Cookie Consent plugin to store whether or not the user has consented to the use of cookies. It does not store any personal data.

Cookie	Durata	Descrizione
nyt-a	1 year	This cookie is set by the provider New York Times. This cookie is used for saving the user preferences. It is used in context with video and audio content.
nyt-gdpr	6 hours	No description available.
nyt-purr	1 year	No description available.

Cookie	Durata	Descrizione
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt.innertube::nextId	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Durata	Descrizione
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_ga_5VXPW099ZB	2 years	This cookie is installed by Google Analytics.
CONSENT	2 years	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.