Le vulnerabilità dei Watermark digitali nell’identificazione dei contenuti Ai

Vulnerabilità dei watermark digitali

I ricercatori del Politecnico di Zurigo hanno evidenziato come i watermark digitali utilizzati per rilevare i testi prodotti dall’intelligenza artificiale siano vulnerabili ad attacchi informatici, compromettendone l’efficacia. Tale tecnologia è stata considerata una soluzione importante nella lotta alle fake news e ai plagi generati dall’AI, tanto da essere prevista anche nell’AI Act, il nuovo regolamento europeo sull’intelligenza artificiale.

Criticità dei watermark avanzati

Nonostante il potenziale dei watermark textuali, i ricercatori del team ETH hanno individuato criticità nei watermark più avanzati. Robin Staab, dottorando ETH, ha evidenziato come siano riusciti a violare diverse tecniche di watermarking basate sull’alternanza di parole “verdi” e “rosse” nel vocabolario del modello AI. Grazie a questa vulnerabilità, sono riusciti a manipolare i testi generati, mettendo in discussione l’efficacia di tali sistemi di protezione.

Attacchi di spoofing e stripping

Attraverso l’utilizzo di un generatore di numeri pseudo-casuali, i ricercatori hanno condotto attacchi di spoofing e stripping ai watermark analizzati. In particolare, lo spoofing ha consentito di creare testi apparentemente watermarked anche se generati da umani, mentre lo stripping ha permesso di rimuovere i watermark dai testi generati dall’AI, rendendoli indistinguibili da quelli scritti da individui reali. L’alto tasso di successo di queste tecniche evidenzia le criticità dei sistemi di watermarking attualmente in uso.

Fragilità dei meccanismi di rilevamento

Studi condotti da accademici come il Prof. Soheil Feizi dell’Università del Maryland hanno confermato le vulnerabilità dei watermark anche su modelli linguistici avanzati come GPT-3 e ChatGPT. Questi risultati mettono in luce l’importanza di adottare un approccio cauto nella diffusione di sistemi di rilevamento così fragili, suggerendo la necessità di ulteriori ricerche e sviluppi per renderli effettivamente affidabili su larga scala.

Prospettive future dei watermark digitali

Nonostante le vulnerabilità evidenziate, i watermark restano uno strumento promettente per identificare i contenuti generati dall’intelligenza artificiale. Nikola Jovanović, co-autore dello studio ETH, sottolinea l’importanza di continuare a lavorare su queste tecnologie prima di considerarle pronte per un utilizzo diffuso. In attesa di progressi significativi, è fondamentale valutare i watermark come un approccio sperimentale, consapevoli delle limitazioni attuali e dell’importanza di una costante evoluzione tecnologica nel settore.

Published by

Francesco Giuliani