Torna una piaga che credevamo sconfitta: la Mucca Pazza ricomincia a fare strage nel mondo digitale | Un grave rischio mai così attuale

dati sintetici
AI compromesse dal morbo della Mucca Pazza – www.iPaddisti.it

Il morbo della “Mucca Pazza” è tornato più forte che mai e, nonostante le sue vittime siano unicamente digitali, la gravità del suo effetto potrebbe danneggiare tutte le intelligenze artificiali che nel tempo hanno raggiunto la loro notorietà.

Tra chatGPT, Midjourney, BardAI e Wall-E2, negli ultimi mesi gli utenti dell’internet hanno avuto modo di sperimentare e divertirsi con dei programmi incredibilmente avanzati che hanno cambiato per sempre il modo di lavorare, intrattenersi e divertirsi.

I modelli di intelligenza artificiale che sono stati usati per programmare questi strumenti utilizzano una tecnica conosciuta come machine learning, che consiste nella fornitura di un’infinità di informazioni “dati in pasto” alle AI cosicché queste possano imparare ed essere addestrate al fine di completare un certo compito.

I dati che vengono raccolti automaticamente possono essere di varia natura, tuttavia le controversie legali che sono venute a galla negli ultimi mesi ha fatto sì che ogni dato coperto da privacy venisse completamente escluso dall’interesse dei bot, i quali si sono alimentati esclusivamente di dati pubblici, presenti sul web, e dati sintetici.

Proprio quest’ultimo aspetto sembrerebbe aver causato dei danni quasi irreparabili alle AI, in quanto pur evitando i problemi legati alle regolamentazioni in materia di protezione dei dati, queste informazioni porterebbero al malfunzionamento dei modelli.

Mucca Pazza digitale, cosa sta accadendo alle AI

Secondo lo studio pubblicato a Luglio 2023,  l’utilizzo di questi dati avrebbe portato alla creazione di un ciclo autofagico chiamato MAD, creando quindi un’analogia con il morbo della mucca pazza in cui le mucche venivano nutrite con scarti di esemplari più giovani arrivando fino alla creazione di agenti patogeni capaci di distruggere il cervello.

ai mucca pazza
Effetti negativi dei dati sintetici – www.iPaddisti.it

L’eccessivo adattamento del modello ai dati forniti, causato dalla mancanza di una varietà sufficiente di dati sintetici, ha portato le AI all’elaborazione di contenuti e risultati sempre più distorti e poco affidabili, evidenziando un grave problema classico del machine learning. La società di consulenza Gartner ha stimato che entro il 2030 i dati sintetici riusciranno a coprire il fabbisogno di informazioni in maniera molto più varia rispetto ai dati reali, evitando così il problema alla radice.

Christian Internò, machine learning researcher al Biefeld University in Germania, in merito ai syntethic data ha dichiarato che: “Il rapporto qualità-convenienza è senza pari, per motivi economici ma non solo. Ci sono applicazioni per le quali acquisire dati reali comporta costi elevati ed enormi quantità di tempo: i synthetic data sono la soluzione. Man mano stiamo scoprendo cose che prima non sapevamo perché non li utilizzavamo in maniera massiccia. Ora bisogna solo imparare a gestirli”.