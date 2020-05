Si sono scritti fiumi di parole sull'Intelligenza Artificiale (AI) e sulle sue immense potenzialità, su come potrebbe cambiare radicalmente il nostro mondo, dalle grandi corporation fino alla vita quotidiana di ognuno di noi. E si è scritta anche molta fantascienza, dove in genere l'AI sfugge al controllo e diventa un problema da risolvere. E anche nel mondo reale sono molti quelli convinti che i pericoli esistano, compreso un non trascurabile rischio esistenziale insito nell'AI. Significa che potrebbe causare l'estinzione del genere umano.

Una delle strategie più comuni, ad oggi, consiste nella selezione accurata dei dati. Se si vuole evitare che l'AI si trasformi in un mostro "alla Skynet" allora bisogna alimentare il sistema di Machine Learning con dati privi di rischi. Una cosa che è molto più facile a dirsi che a farsi.

Secondo Richard Tomsett, ricercatore in ambito AI presso IBM, "i nostri sistemai AI sono validi quanto i dati che usiamo per addestrarli. Mano a mano che l'AI si fa spazio in ogni aspetto della nostra vita, diventa importante e critico assicurarsi che i dati siano corretti, giusti, equi, interpretabili e privi di pregiudizio".

In assenza di controllo, pregiudizi ed errori presenti nei dati possono amplificarsi a dismisura, di pari passo con la crescita del sistema e il diffondersi di soluzioni AI sempre più complesse. Il problema è particolarmente grave in scenari come quello odierno, dove i dati vengono semplicemente dai in pasto agli algoritmi, senza controllo preventivo. Il controllo e la verifica dei dati, oggi, non è oggetto di alcuna regolazione ed è più che altro una cosa occasionale, che i ricercatori fanno su base volontaria.

Alcuni problemi sono facili da capire: un'AI addestrata con dati sbagliati potrebbe applicare pregiudizi razziali, di genere o di religione (o di altro tipo), quando seleziona i candidati per un lavoro o decide a chi assegnare un prestito. Altri aspetti invece sono molto meno ovvi.

In effetti i problemi di pregiudizio legati alle AI sono incredibilmente complessi e toccano molti temi diversi, non sempre di natura tecnologica. Si tratta di manipolare correttamente i dati e nel rispetto della privacy, ma anche di gestire i dati della storia umana con un approccio sociale e politico che sia il più giusto ed equo possibile. Si tratta, in altre parole, di una questione che è tanto politica quanto tecnologica.

A rendere la faccenda ancora più ingarbugliata c'è poi il chi deve definire cosa sia il pregiudizio, chi dovrebbe trasformare le idee in pratica, chi farle applicare, chi fare i controlli. Prima di tutto, in effetti, qualcuno dovrebbe stabilire che cos'è un pregiudizio. Dalla macchina si torna all'umano, con tutte le debolezze che ci contraddistinguono da sempre.

Che cos'è il pregiudizio (bias) negli algoritmi?

Il "pregiudizio algoritmico" si verifica quando un algoritmo teoricamente imparziale giunge a una decisione discriminatoria. La discriminazione è una conseguenza quasi esclusiva dei pregiudizi insiti nel set di dati usati per addestrare la macchina, che appunto li usa per prendere le proprie decisioni.

Sviluppiamo algoritmi che prendono decisioni al posto nostro, o che se non altro aiutano noi a prendere decisioni complesse. Se pero l'AI ha un "pregiudizio integrato", è facile capire come la questione passi da opportunità a problema da risolvere. Problemi che potrebbero essere trascurabili o enormi.

Per esempio, prendiamo un algoritmo il cui scopo è prevedere la domanda per un certo prodotto. Lo alimentiamo con dati demografici incompleti o errati, ed ecco che la sua previsione porta a una perdita di profitti, perché l'azienda non ha abbastanza di quel prodotto per soddisfare la domande. Oppure perdite più concrete, perché si produce troppo di quel dato prodotto, che poi resta invenduto.

Similmente, ci sono algoritmi per stabilire a chi concedere un'assicurazione e a quali condizioni, algoritmi per selezionare il personale da assumere, per decidere le aspettative di vita... ce ne sono praticamente per ogni cosa. E ognuno di essi ha probabilmente un problema di pregiudizio, che deriva sempre dal set di dati utilizzato.

(Image credit: Shutterstock / carlos castilla)

Secondo Jack Vernon, Senior Research Analyst presso IDC, questo problema rende l'AI quasi inutile.

"Il problema è quando l'algoritmo si trascina dietro pregiudizi non intenzionali o problematici. Questi possono avere due fonti, in genere: i dati e l'algoritmo stesso", ha spiegato a TechRadar Pro via email

"I problemi con i dati sono facili da capire: se il set di dati ha un qualche tipo di problematicità soggiacente, è molto probabile che l'algoritmo la troverà e la amplificherà".

"Gli algoritmi possono inoltre sviluppare nuovi pregiudizi per errore ... c'è il caso famoso di un sistema sviluppato per distinguere gli orsi polari dagli orsi bruni, che alla fine fu scartato perché basava la propria scelta sul fatto che il terreno fosse coperto di neve oppure no, ignorando del tutto le caratteristiche dell'orso stesso".

L'esempio di Vernon è estremo ma utile per capire in quali modi un algoritmo può allontanarsi dal suo scopo originale. Sviluppare algoritmi autonomi o semiautonomi dunque può diventare un problema, persino una minaccia, se i problemi non vengono individuati.

Il problema più grande è probabilmente quello che si verifica quando un algoritmo intensifica svantaggi e discriminazioni già esistenti. In altre parole, un'AI pregiudiziale difficilmente rifiuterà un credito a un impiegato bancario per errore, ma potrebbe farlo con più probabilità se la persona appartiene a una minoranza etnica; per il semplice fatto che queste persone, storicamente rappresentano una porzione maggiore tra i clienti a cui è stato rifiutato un credito. Se l'AI si limita ripetere il modello storico che ha individuato, tuttavia, sta applicando un modello pregiudiziale - il che non aiuterebbe né i clienti né la banca.

La questione della rappresentazione giusta

Glai esperti che abbiamo consultato per scrivere questo articolo sono concordi nel dire che per creare un'AI con meno pregiudizi possibile, andrebbe sviluppata da un team umanamente variegato, e alimentata con dati presi da una grande varietà di fonti.

Il settore della tecnologia, tuttavia, mostra da sempre la situazione opposta: c'è pochissima diversità etnica e di genere - di fatto, la maggior parte delle persone che ci lavorano sono maschi bianchi. I dati disponibili sono variegati ma raccontano tutti la stessa storia: donne e minoranze etniche sono sottorappresentate nelle aziende hi-tech, compresi (o a cominciare da) colossi come Google o Microsoft.

(Image credit: Shutterstock / elenabsl)

(Image credit: Shutterstock / Laurent T)