Letture e riflessioni di Gabriella: “Big Data: una rivoluzione che trasformerà il nostro modo di vivere – e già minaccia la nostra libertà.”

Il titolo di questo libro dice molto delle opportunità e dei pericoli per la vita sociale e personale che conseguono alle enormi quantità di dati personali in mano alle principali piattaforme internet (Google, Facebook, Amazon, Netflix etc). Proviamo a chiarirci un po’ le idee.

Innanzitutto, vediamo la presentazione dei big data da parte di un sito italiano, Cloud Talk, che dai suoi editori viene così definito: “magazine online, ideato e realizzato con un preciso obiettivo: favorire il più rapido, efficace e consapevole processo di digitalizzazione del nostro Paese”, sito estremamente ottimista nella valutazione dell’attuale e futuro impatto dei Big Data sulle imprese e sulla società in generale:

“È importante iniziare con il dire che lo stesso termine Big Data è alquanto fuorviante. La traduzione grandi dati  o grossi dati, infatti, fa pensare all’enorme quantità di dati oggi disponibili in diversi settori e, in automatico, porta a concludere che per rivoluzione Big Data si intendono le opportunità oggi disponibili di avere così tante informazioni al servizio business. Questa conclusione è vera solo in minima parte. Anche perché esistono settori dove i dati, per quanto ve ne siano davvero in ingenti quantità, non sono sempre disponibili a tutti e, soprattutto, non vengono sempre condivisi. Lasciando stare questo aspetto, che verrà ripreso in chiusura, l’effettiva quantità di dati oggi generati è abnorme: dai telefoni alle carte di credito usate per gli acquisti, dalla televisione agli storage necessari per le applicazioni dei computer, dalle infrastrutture intelligenti delle città, fino ai sensori montati sugli edifici, sui mezzi di trasporto pubblici e privati e via discorrendo. I dati vengono generati con un flusso così crescente che tutte le informazioni accumulate nel corso degli ultimi due anni ha superato l’ordine dei Zettabyte (1021 byte), segnando un record per l’umana civiltà. Come si diceva, però, per quanto di dati ve ne siano davvero in quantità indicibile, la vera rivoluzione a cui ci si riferisce parlando di Big Data non è questa, quanto la capacità di usare tutti queste informazioni per elaborare, analizzare e trovare riscontri oggettivi su diverse tematiche. La rivoluzione Big Data e, in generale, il termine Big Data si riferisce proprio a cosa si può fare con tutta questa quantità di informazioni, ossia agli algoritmi capaci di trattare così tante variabili in poco tempo e con poche risorse computazionali. Il paragone è presto e fatto: fino a poco tempo, uno scienziato per analizzare una montagna di dati che oggi definiremmo Small o Medium Data avrebbe impiegato molto tempo e si sarebbe servito di computer mainframe da oltre 2 milioni di dollari. Oggi, con un semplice algoritmo, quelle stesse informazioni possono essere elaborate nel giro di poche ore, magari sfruttando un semplice laptop per accedere alla piattaforma di analisi.

Questa è la rivoluzione Big Data. Questi sono i Big Data che presuppongono nuove capacità di collegare fra loro le informazioni per fornire un approccio visuale ai dati, suggerendo pattern e modelli di interpretazione fino a ora inimmaginabili. [.…] I Big Data sono necessari e utili nei mercati business più disparati, dalle automobile, alla medicina, dal commercio all’astronomia, dalla biologia alla chimica farmaceutica, dalla finanza al mondo dei videogiochi. Nessun settore in cui esiste un marketing e dei dati da analizzare può dirsi indenne dalla rivoluzione Big Data. E questa rivoluzione tocca le vite di ogni singola persona senza che nessuno se ne accorga.

Ecco alcuni esempi di cosa sono capaci i Big Data. In ambito marketing, l’uso dei Big Data è famigliare nella costruzione dei così detti metodi di raccomandazione, come quelli utilizzati da Netflix e Amazon per fare proposte di acquisto sulla base degli interessi di un cliente rispetto a quelli di milioni di altri. Tutti i dati provenienti dalla navigazione di un utente, dai suoi precedenti acquisti, dai prodotti valutati o ricercati permettono ai colossi del commercio (elettronico e non) di suggerire i prodotti più adatti agli scopi del cliente, quelli che solleticano la sua curiosità e lo spingono a comprare per necessità momentanea, permanente o per semplice impulso. Appartenenti ai Big Data sono gli algoritmi che riescono a predire se una shopper donna è incinta, tracciando le sue ricerche sul Web e gli oggetti acquisiti in precedenza, come lozioni e via discorrendo. Una volta individuato il particolare stato, a quella stessa utente si offrono offerte speciali e coupon su prodotti inerenti al proprio stato. Con l’aiuto dei Big Data, le stesse società emettitrici delle carte di credito hanno individuato delle associazioni inusuali per valutare il rischio finanziario di una persona. Secondo alcune ricerche di estrazione dei dati, infatti, le persone che comprano i feltrini per i mobili rappresentano i clienti migliori per gli istituti di credito, perché più attenti e propensi a colmare i propri debiti nei tempi giusti.

Nella sfera pubblica, ci sono tantissimi altri tipi di applicazioni per i Big Data:

  • il dispiegamento delle forze di polizia dove e quando i reati hanno una maggiore probabilità di verificarsi;
  • lo studio delle associazioni tra la qualità dell’aria e la salute;
  • l’analisi genomica per migliorare la resistenza alla siccità delle colture di riso;
  • la creazione di modelli per analizzare i dati provenienti dagli essere viventi nelle scienze biologiche;
  • e tanto altro ancora.

Un ultimo esempio, forse il più calzante, è il progetto condotto da Google. Mountain View, analizzando i gruppi dei termini di ricerca digitati dagli utenti sul proprio motore, era riuscito a prevedere (nel 2009) l’avanzamento dei focolai di influenza H1N1 nei territori degli USA più velocemente di come lo stesso ministero della salute non fosse riuscito a fare utilizzando i record di ammissione ospedaliera delle strutture sanitare pubbliche e private.

Tutto questo sembra così fantascientifico, ma, in realtà, è solo una piccolissima frazione di quello che i Big Data potrebbero fare. Per quanto possa sembrare tutto così semplice, l’evoluzione dei Big Data non è così alla portata di mano per l’umanità. L’ostacolo preminente da superare è la diffidenza delle aziende, dei centri di ricerca e di taluni scienziati a condividere i dati su cui i Big Data potrebbero lavorare. A dimostrazione di questo, basti pensare alle Università dove vengono effettuati alcuni studi ai cui dati e al materiale di lavoro originale non è fornito libero accesso, se non si fa parte del team di co-autori. Così, il campo della medicina rappresenta quello dove forse c’è il maggior spreco di dati e le peggiori conseguenze: nonostante esistano i mezzi forniti dai Big Data, ogni giorno continuano a morire milioni di persone, anche perché i dati non vengono condivisi. Superata la diffidenza e l’ignoranza in questo senso, i Big Data possono supportare al meglio la raccolta, la classificazione, l’analisi e la sintesi dei dati di un determinato settore, offrendo informazioni preziose che vanno al di là del semplice dato grezzo”.

Nelle ultime frasi sentiamo come viene demonizzato un approccio ai Big Data differente da quello ritenuto “utile” alla società, secondo valori che sono occidentali, ma non evidentemente crisitiani.

In effetti, in un altro articolo dello stesso sito si conviene che: “La semplicità di accesso alle analytics, comunque, non può di certo avvenire se non con una adeguata formazione degli utenti al fine di garantire che gli strumenti vengano utilizzati in modo appropriato e per fare in modo che la fatica comunque profusa non sia inutile e vana ai fini delle decisioni aziendali. A fronte di tutti questi benefici che le analytics sono in grado di garantire da qui ai prossimi anni, c’è comunque il rovescio della medaglia: tutti questi dati e la semplificazione degli strumenti per analizzarli possono condurre a forti rischi di abuso, anche se c’è da dire che tali pericoli non debbano per forza essere peggiori di quelli già associati ad altre tipologie di strumenti di business intelligence.”

Vediano alcuni articoli che rivelano altri aspetti di questo “rovescio della medaglia”.

Un’inchiesta svolta da due giornalisti del Das Magazin di Zurigo, (H. Grasseger e M. Krogerus, The Data That Turned the World Upside Down, 28 gennaio 2017) vuole dimostrare come la vittoria elettorale di Trump sia stata facilitata da una società inglese, la “Cambridge Analytica”, che nella sua presentazione sul sito promette: “I dati guidano tutto ciò che facciamo. Cambridge Analytica usa i dati per cambiare il comportamento del pubblico. Visita le nostre divisioni Commerciali e Politiche per vedere come ti possiamo aiutare”. Pare che questa società sia in grado di “profilare”, cioè di prevedere le aspirazioni, i desideri, le idee, i comportamenti di categorie di individui, se non addirittura di singoli individui, in modo da inviare messaggi personalizzati sulle loro preferenze al fine di convincere gli indecisi a votare un candidato piuttosto che un altro o ad andare a votare piuttosto che no. Questo lavoro di profiling sarebbe stato possibile sfruttando il lavoro di un’équipe inglese di neuropsicologi guidata da M. Kosinski, che, incrociando le risposte di milioni di persone a un test di personalità (raccolte con l’App MyPersonality) con i loro profili Facebook, ha dimostrato di poter predire, sulla base di 68 “mi piace” postati da un utente su Facebook, il colore della pelle (con una accuratezza del 95%), l’orientamento sessuale (88%) e l’adesione al Partito Democratico o Repubblicano (85%). Non solo, si possono determinare l’intelligenza, il credo religioso, l’uso di sigarette o alcol. Con 10 mi piace, utilizzando questo modello, puoi valutare una persona meglio dei suoi colleghi, con 70 conosci quella persona meglio dei suoi amici, con 150 meglio dei genitori, con 300 meglio del coniuge. Forse meglio di sé stessa.

Le conseguenze sono immense: puoi pensare di prevedere quello che “quella persona” farà e, se sei un governo, potresti pensare di arrestarla prima che commetta un reato, solo sulla forte probabilità che lo commetta. E poiché quello che viene definito “reato” o “comportamento antisociale” o “giusto”, “sbagliato”, “appropriato”, “sano” può cambiare a seconda degli orientamenti culturali di una società, ma anche a seconda del vantaggio dei potenti, i dati che tu metti inconsapevolmente in rete possono diventare pericolosi per la tua libertà o anche “solo” per il tuo lavoro, per la tua probabilità di sottoscrivere una assicurazione per la salute o un mutuo etc.

Né si può immaginare che i dati, anche se resi disponibili in forma anonima, restino anonimi. Meyer-Schonberger e Cukier raccontano che i Big Data, grazie all’incremento e alla varietà delle informazioni che si possono incrociare, facilitano la reidentificazione: “Nel 2006 AOL (un internet provider americano) ha reso pubbliche un enorme quantità di vecchie queries, nel meritorio intento di aiutare i ricercatori a ricavare utili indicazioni. Il dataset composto da 20 milioni di queries digitate da 657.000 utenti era stato accuratamente anonimizzato. Informazioni personali come lo username o l’indirizzo IP erano state cancellate e rimpiazzate da codici identificativi numerici. [….] Eppure, nel giro di pochi giorni, il New York Times ha analizzato queries come “uomini single settantenni”, “tè per la salute” e “giardinieri di Lilburn” arrivando a identificare nell’utente 4417749 Thelma Arnold, una vedova sessantaduenne di Lilburn, Georgia. “Diamine, è tutta la mia vita personale” ha detto al cronista del Times quando si è presentato alla sua porta “Non immaginavo proprio che qualcuno mi sorvegliasse”. Appena due mesi dopo, nell’ottobre 2006, il servizio di videonoleggio Netflix ha fatti una cosa abbastanza simile. [….] Ha pubblicato gli ordini di quasi mezzo milione di utenti. [….] Anche in questo caso tutti i possibili elementi di identificazione erano stati accuratamente rimossi dai dati. E anche in questo caso è stato reidentificato un utente: una madre segretamente lesbica del Midwest conservatore, che ha poi citato in giudizio Netflix.”

Ritornando a Cambridge Analytica, essa è una società satellite di SCL (Strategy Communication Laboratories). “Altri rami di questa società madre- continua l’inchiesta su Das Magazin– sono stati coinvolti in movimenti elettorali dall’Ucraina alla Nigeria, hanno aiutato la monarchia Nepalese contro I ribelli, hanno sviluppato metodi per influenzare I cittadini dell’Europa Orientale e I cittadini afgani a favour della NATO”  In una intervista al Sole24 ore (Giovanni Minoli, 10 gennaio 2017) la ricercatrice italiana di CA, Federica Nocera, ha rivelato che la società, mentre era impegnata nel supporto a Trump nel periodo pre-elettorale, aveva a disposizione un database su circa 200 milioni di americani

Evgenij Morozov, sociologo e giornalista bielorusso, esperto di nuovi media, fa notare come uno dei problemi di questo accumulo stratosferico di dati, riguardanti gran parte della popolazione mondiale con l’eccezione della Cina, è che essi siano in mano a poche compagnie della Silicon Valley. Questo rende molto pericoloso il non improbabile scenario futuro in cui un manager di una di queste società, se non Mark Zuckerberg stesso (uno dei fondatori di Facebook), potrebbe candidarsi alla Casa Bianca. Tanto più inquietante è la previsione che otterrebbe un larghissimo consenso perché internet facilita talmente la vista delle persone che ormai la gente pare insofferente al controllo e alle limitazioni che gli Stati cercano di porre a queste compagnie.

Non ci deve rassicurare che tutti gli esempi si riferiscano agli Stati Uniti. Anche la società  e la politica italiana pare funzionino così. Secondo l’analisi di Giuliano da Empoli (Newsletter Voltaitalia 13 febbraio 2017) “la forza del Movimento 5 Stelle si basa sull’unione paritaria di due componenti, quella analogica e quella digitale. [….] Grillo e Casaleggio in realtà decidono sulla base dei big data” . [….]

Concludiamo con la riflessione di Meyer-Schonberger e Cukier: “I benefici per la società saranno innumerevoli, perché i big data entreranno a fare parte della soluzione a problemi globali impellenti, come il cambiamento climatico, la lotta alle malattie endemiche e la promozione del buon governo e dello sviluppo economico. Ma l’era dei big data ci obbliga anche a prepararci meglio per le sfide che la nuova tecnologia porrà alle nostre istituzioni e a noi stessi. [….] Che ruolo rimane all’intuito, alla fede, all’incertezza, all’agire in contraddizione con il dato empirico e all’apprendimento dall’esperienza?”.

Manteniamoci quindi vigili e attenti perché Gesù dice anche a noi come alle folle “Ipocriti! Sapete giudicare l’aspetto della terra e del cielo, come mai questo tempo non sapete giudicarlo? E perché non giudicate da voi stessi ciò che è giusto?” (Lc,12,55-56).