Con l’ascesa dell’intelligenza artificiale (AI), sono aumentati anche i casi di disinformazione e plagio dei lavori delle persone. Alcuni dei nomi più noti nel campo sono stati portati in tribunale per questo motivo, e la situazione sembra peggiorare. Per affrontare questi problemi, Google ha introdotto nel 2023 uno strumento chiamato SynthID, che permette di inserire watermark digitali direttamente nelle immagini, video e testi generati dall’AI.
Recentemente, Google ha deciso di rendere open source il componente di watermarking testuale di SynthID.
Cos’è SynthID Text?
SynthID Text è pensato come una soluzione per identificare il testo generato dall’AI. Può funzionare insieme a un LLM (Large Language Model, modello di linguaggio di grandi dimensioni) senza influire sulle prestazioni, sulla precisione o sulla qualità della generazione. Utilizza una funzione pseudocasuale chiamata g-function che opera in background, aggiungendo un watermark che non può essere riconosciuto da un essere umano.
Attualmente, SynthID Text è utilizzato da Gemini e da vari altri chatbot aziendali online di Google. Ora, può essere implementato anche su altri modelli di AI e LLM.
Dichiarazioni e Limitazioni
In una conversazione con MIT Technology Review, Pushmeet Kohli, Vice President (Vicepresidente) di Ricerca di Google DeepMind, ha affermato che ora altri sviluppatori di AI generativa potranno utilizzare questa tecnologia per aiutarli a rilevare se i testi prodotti provengono dai loro modelli di linguaggio, facilitando lo sviluppo responsabile dell’AI.
Limitazioni di SynthID Text
Prima di implementare SynthID Text nel tuo modello di AI, è importante considerare alcune limitazioni. Anche se può proteggere contro il testo ritagliato e le parole modificate, il watermarking è meno efficace con le risposte fattuali. Le risposte fattuali sono risposte che si basano su fatti verificabili e informazioni oggettive, piuttosto che su opinioni, speculazioni o interpretazioni. Queste risposte forniscono dati concreti, numeri, date, eventi storici e altre informazioni che possono essere confermate e validate da fonti affidabili. Ad esempio, se chiedi “Qual è la capitale della Francia?†una risposta fattuale sarebbe “Parigiâ€. Questo tipo di risposta si basa su un fatto riconosciuto e non lascia spazio a interpretazioni personali.
Inoltre, è inefficace quando il testo generato dall’AI è completamente riscritto o tradotto in un’altra lingua.
Vuoi Saperne di Più?
Se desideri approfondire i dettagli tecnici di SynthID Text, vale la pena leggere il technical paper (documento tecnico). In alternativa, per una panoramica, puoi legger la documentazione ufficiale e l’annuncio sul blog di su Hugging Face.
Google ha anche reso disponibili una implementazione di riferimento e una demo di SynthID Text.
Fonte: https://news.itsfoss.com/google-synthid-text-open-source/
Source: Read More