Meta è attualmente coinvolta in una controversia riguardante le modalità di addestramento dei suoi nuovi modelli linguistici, Llama 4. Accuse di utilizzo improprio dei dati dei benchmark per migliorare artificialmente i punteggi delle performance sono state smentite dal Vice Presidente della divisione AI generativa, Ahmad Al-Dahle. La situazione ha attirato l’attenzione del pubblico e degli esperti del settore.
Le nuove generazioni di modelli Llama 4
La settimana scorsa, Meta ha presentato la sua nuova suite di modelli linguistici chiamata Llama 4, che include tre varianti principali: Scout, Maverick e Behemoth. Questi modelli fanno parte di un sistema AI multimodale avanzato progettato per affrontare diverse sfide nel campo dell’intelligenza artificiale.
Il modello Scout è stato sviluppato con l’obiettivo di essere altamente efficiente; può operare su una singola GPU Nvidia H100 e gestire una finestra contestuale impressionante di 10 milioni di token. Maverick rappresenta un passo avanti in termini dimensionale e prestazionale: secondo quanto dichiarato da Meta, questo modello è in grado di competere con altri leader del settore come GPT-4 e DeepSeek-V3 nei compiti più complessi legati alla programmazione e al ragionamento logico. Infine, Behemoth si distingue come il modello più potente della famiglia Llama con i suoi 288 miliardi di parametri attivi , promettendo prestazioni superiori a quelle offerte da GPT-4.5 e Claude Sonnet 3.7 nei benchmark scientifici.
Le accuse a Meta
Le polemiche sono emerse quando alcune fonti anonime hanno insinuato che la dirigenza avrebbe suggerito l’inclusione dei dati dai benchmark durante il processo post-addestramento per garantire risultati accettabili entro una scadenza fissata a fine aprile. Questo comportamento sarebbe stato motivato dalla necessità urgente di ottenere performance competitive rispetto ai migliori modelli open source disponibili sul mercato.
Il post anonimo ha descritto questa pratica come eticamente discutibile dal punto di vista accademico ed evidenziava già segnalazioni riguardanti le scarse performance reali dei modelli pubblicati online. Inoltre, si vociferava anche delle dimissioni imminenti all’interno della dirigenza AI dell’azienda proprio a causa delle pressioni legate alle prestazioni insoddisfacenti.
Dopo il lancio ufficiale della suite Llama 4, sono circolate voci secondo cui Meta avrebbe contaminato il processo d’addestramento specificamente per Maverick e gli altri due modelli includendo dati non autorizzati provenienti dai benchmark utilizzati nel settore. Queste affermazioni sarebbero originate da un ex dipendente dell’azienda che avrebbe rivelato informazioni su un forum cinese prima delle sue dimissioni.
La risposta della compagnia
In risposta alle accuse diffuse sui social media come X e Reddit, Ahmad Al-Dahle ha categoricamente negato ogni addebito dichiarando che tali affermazioni “non corrispondono alla verità”. Ha sottolineato l’impegno etico dell’azienda nel rispettare standard elevati nella ricerca sull’intelligenza artificiale.
Tuttavia, la credibilità delle voci accusatorie è stata alimentata dalle segnalazioni degli utenti riguardo differenze significative tra la versione pubblica del modello Maverick disponibile agli sviluppatori rispetto a quella mostrata su piattaforme specializzate come LMArena. Qui Meta aveva indicato chiaramente che la versione presentata era considerata “sperimentale” ed aveva ottenuto punteggi ELO particolarmente elevati .
Al-Dahle ha cercato anche spiegazione alle discrepanze riscontrate dagli utenti affermando che i diversi servizi potrebbero non essere stati ottimizzati correttamente subito dopo il rilascio; infatti, alcuni giorni sarebbero necessari affinché tutte le implementazioni pubbliche siano messe a punto adeguatamente.
La situazione rimane complessa: ci sono accuse gravi contro Meta ma anche smentite decise dall’azienda stessa; sarà fondamentale monitorare le performance effettive dei nuovi modelli nelle settimane future per comprendere se ci siano fondamenti nelle critiche rivolte all’operatività interna dell’azienda tech californiana.