L’Olanda incoraggia i contratti con i redattori a sviluppare il loro stato AI

I Paesi Bassi hanno preso una svolta nello sviluppo dell’intelligenza artificiale. Questo giovedì, il governo olandese ha riconosciuto che il modello linguistico dello stato e il GPT-NL avevano bisogno di autorità espressa dagli autori per utilizzare i loro testi nel processo di formazione. AII può ridefinire le regole del gioco, specialmente in campo pubblico.
In alternativa ai giganti privati statunitensi e cinesi, il dirigente olandese è uno di quelli che scommettono sui modelli di intelligenza artificiale promossi dal pubblico: Chatgpt, Gemini o Deepsek. Un modo poco dopo il governo spagnolo seguito Performance di Alia“Il suo progetto che protegge lo spagnolo. Due modelli, come confermati dai loro promotori, sono addestrati con” dati di alta qualità. “Ma ora la distanza del marchio olandese.
“A differenza di alcuni modelli internazionali utilizzati come” copia Internet di Internet “, il governo olandese ha affermato che i dati protetti dal GPT-NL da Copyright raccolgono e doni a coloro che contribuiscono al loro contenuto.” Un posto per lasciare altri sviluppi aperti che non hanno ancora chiarito come ottengono dati per alimentare i loro modelli. Uno di questi è l’Alia spagnola, sotto l’ingrandimento di aziende che già confermano la proprietà intellettuale.
Le caratteristiche tecniche del progetto Alia hanno menzionato i set di dati utilizzati per formare il modello. Le risorse specificate includono Gitub, Wikipedia, Yurlex e un database chiamato Crawl solito, che ha provocato forti critiche per la raccolta di pesanti contenuti su Internet senza potere. “Sì, il governo lo ha usato e riconosciuto pubblicamente sui propri siti Web”, ha detto uno specialista di Eva Moraga durante lo spettacolo parlamentare di giugno. “Crawl comune raccoglie contenuti senza una precedente autorità”, ha detto. Tuttavia, il repository gestito dal “che è un’organizzazione in uscita, che è responsabile del modello, viene aggiornato mensilmente e distribuito ai sensi della licenza di dominio pubblico CC0 1.0. “
Nel gennaio 2025, il Sedro (Spanish Center for Reprography Rights) ha rimosso il contenuto editoriale spagnolo dal suo repository dal suo repository in modo che la sua inclusione fosse il minimo problema. Tuttavia, a quel punto, la formazione dei modelli – o almeno la prevenzione – è già stata completata. “Chi vedrà il guardiano?” Molti hanno chiesto ai senatori.
Combatti per il copyright
La maggior parte degli utenti ricorre ad Openai o Google Gemini per ottenere risposte immediate. Ci sono centinaia di regole matematiche, modelli statistici e volumi di testo pesanti dietro quelle semplici interazioni.
Questi set di dati hanno tutti i tipi di problemi dalla salute e dalla scienza all’economia e alla politica. Token – parole di parole o punteggiatura – raccolte da fonti originali mediante metodi di raschiatura, ovvero informazioni automatiche su Internet. Nella maggior parte dei casi, questo processo viene eseguito senza consenso o compensazione per gli scrittori di contenuti.
I Paesi Bassi cercheranno sicuramente di invertire quella logica. “Abbiamo raggiunto i contratti per ottenere gli editori adeguati quando il modello viene lanciato sul mercato”, ha affermato l’esecutivo. “Ciò è in linea con le normative europee, incluso l’Artificial Intelligence Act”, hanno affermato.
Il riconoscimento ufficiale del governo olandese ha esercitato pressioni sui paesi che hanno promosso i modelli di intelligenza artificiale dal pubblico. Il problema sull’origine dei dati e il rispetto del copyright si sta sviluppando in una delle principali sfide di controllo nell’espansione di queste tecnologie. Nel frattempo, questa discussione è aperta in parlamento e sviluppatori.