iSA, il software che cattura le opinioni online

Ecco com’è nato, negli scantinati della Statale di Milano, il più sofisticato mezzo per monitorare i social network.
Sono gli ultimi mesi del 2010, due uomini, seduti in un bar di Tokyo, hanno in mano una birra nipponica e in mente un’idea che potrebbe modificare il modo in cui viene letto ed interpretato il mondo. Questi uomini sono Luigi Curini e Stefano Iacus, docenti all’università degli Studi di Milano in Scienze Politiche e Probabilità e Statistica Matematica, padri di iSA (Integrated Sentiment Analysis), un algoritmo che monitora le opinioni espresse in Rete in maniera molto efficiente, forse la più efficiente mai sperimentata finora. L’algoritmo iSA è ispirato alle ricerche di Gary King a Harvard ma con l’obiettivo di migliorarle. Infatti ha ottenuto un tasso di accuratezza del 97% e si è classificato come l’unico algoritmo in grado finora di cogliere le motivazioni che stanno dietro a un’idea.
Così i due docenti creano Voices from the Blogs, un osservatorio scientifico che nel dicembre 2012 è divenuto una startup e spin-off dell’Università degli Studi di Milano. Da quel momento, il progetto iSA inizia rapidamente a decollare. Ben presto si sono aperte numerose collaborazioni con media e aziende nazionali e internazionali, l’ultima più recente è stata instaurata con il giornale britannico The Guardian. Solo nel nostro Paese sono stati analizzati oltre 400 milioni di post e archiviati circa 300 milioni di testi.
Sembrerebbe un gioiellino di tecnologia partorito dalla Silicon Valley e invece è un prodotto assolutamente Made in Italy, nato negli scantinati della facoltà di Scienze Politiche, in via Conservatorio a Milano. L’algoritmo iSA è stato premiato anche all’interno del contest promosso da Google e Istat intitolato “Produrre statistica ufficiale con i Big Data”.
Ai due docenti Curini e Iacus si sono aggiunti Giuseppe Porro, docente di economia all’Università degli Studi dell’Insubria, e Andrea Ceron, ricercatore in Scienze Politiche all’ateneo milanese. Si lavora sull’algoritmo, autofinanziati, nei locali e con i server dell’Università. Poi arrivano le prime commissioni dalla Camera di Commercio di Milano e di Monza e Brianza, che “hanno investito al buio sul progetto”.
Cosa fa esattamente iSA
Il primo vero banco di prova è stata l’analisi delle opinioni in Rete riguardo all’aggressione all’allora premier Silvio Berlusconi in piazza Duomo a Milano, nel 2009.
Volevamo capire se un evento traumatico come quello avrebbe comportato un cambiamento di opinione, ai tempi molto critica, nei confronti del Presidente del Consiglio. E in effetti era una delle cose che eravamo riusciti a catturare
spiega Ceron.
È stata la nostra prima analisi, fatta con un paio di migliaia di post – sorride – quella realizzata per il giornale britannico The Guardian, per determinare il sostegno all’Isis da parte del mondo arabo, ne ha passati in rassegna due milioni e 500 mila.
L’utilizzo dei Big Data
Per arrivare a questo risultato sono stati compiuti oltre 600 studi, fra pubblici e privati. Diversi big data sono stati tenuti sotto osservazione da iSA, tra cui la felicità degli italiani su Twitter, che è monitorata tutti i giorni dal 2012, l’andamento delle 110 province italiane, l’indice di speranza di ripresa del Paese, e persino le previsioni dei risultati elettorali americani, francesi e italiani.
Ma l’algoritmo iSA supera gli altri non solo sui grandi numeri:
Le società di analisi utilizzano motori di ricerca semantici che stabiliscono a priori le regole per identificare un testo e poi fanno tutto in automatico,
spiega Iacus.
Il linguaggio è in continua evoluzione sulla scorta non solo dell’argomento ma anche dell’età e del sostrato culturale di chi scrive. Elementi difficilmente percepibili da un algoritmo in maniera autonoma ma che, anzi, gli dovranno essere insegnati. Difatti, l’elemento chiave per arrivare a un’accuratezza del 97% sono proprio le persone.
Come funziona l’algoritmo
Il funzionamento di iSA si basa su una prima fase di analisi manuale e identificazione del contenuto di circa 1000 post. In questo modo è in grado di apprendere il linguaggio-tipo utilizzato per parlare di un certo argomento, dopodiché è in grado di espandere la sua analisi all’intero universo che ne discute.
Funziona un pò come un bambino all’inizio bisogna aiutarlo a stare in piedi. Poi corre da solo
afferma Curini.
Sono circa una ventina i codificatori, tra studenti e tesisti, esperti di argomenti o di lingua, che sono regolarmente pagati per aiutare iSA nell’apprendimento.
Risulta simpatico notare come le analisi di Voices siano così accurate ma senza che venga posta alcuna domanda. Le risposte si trovano già sia in Rete che sui Social Network. Infatti, è la gente che le fornisce liberamente e anche in via indiretta.
Continua Curini:
Su tutte le tematiche un pò delicate a domanda diretta si tende a non dire esattamente la propria opinione ma conformarsi a quello che si ritiene più politically correct. Sui social invece tutti sembrano dimenticarsi il concetto di privacy. E noi stiamo ad ascoltare.
Non siamo l’oracolo – ci tengono a ribadire i docenti – chi scrive in Rete non è necessariamente sinonimo dell’italiano medio. Però è vero che sui grandi numeri si coglie una tendenza e lo si fa in tempo reale. Al momento un italiano su due è su Facebook. Un numero che si allargherà sempre più e ci permetterà di cogliere un segnale sempre più raffinato.
L’orgoglio di Curini, Iacus e Ceron è facilmente percepibile:
Siamo arrivati sul The Guardian dalla nostra scrivania e abbiamo appena aperto una nuova sede nel co-working Talent Garden, in via Merano, dove lavoreranno due persone. Un modo per segnare il territorio in attesa della piccola, e ancora segretissima, rivoluzione in programma per il 2015. In cantiere ci sono collaborazioni e prodotti internazionali. La fase di gestazione di Voices è finita. Ora corre da sola.
Aldo Palo