OpenAI e Google hanno addestrato i loro modelli di intelligenza artificiale sul testo trascritto dai video di YouTube, violando potenzialmente i diritti d'autore dei creatori di contenuti, secondo New York Times. Il rapporto, che descrive gli sforzi delle aziende OpenAI, Google e Meta per massimizzare la quantità di dati che possono fornire ai loro sistemi di intelligenza artificiale, cita diverse persone con conoscenza delle pratiche delle aziende. Ciò avviene pochi giorni dopo che il CEO di YouTube Neil Mohan ha dichiarato in un'intervista a… Origini di Bloomberg Il presunto utilizzo da parte di OpenAI dei video di YouTube per addestrare il suo nuovo generatore di testo in video, Sora, Andrà contro le politiche della piattaforma.
Secondo il OraOpenAI ha utilizzato lo strumento di riconoscimento vocale Whisper per trascrivere più di un milione di ore di video di YouTube, che è stato poi utilizzato per addestrare GPT-4. l'informazione In precedenza ho riferito che OpenAI ha utilizzato video e podcast di YouTube per addestrare i suoi sistemi di intelligenza artificiale. Secondo quanto riferito, il capo di OpenAI Greg Brockman era tra le persone di quella squadra. Matt Bryant, portavoce di Google, ha affermato che secondo le regole di Google, “il ritaglio o il download non autorizzato di contenuti di YouTube” non è consentito. OraDicendo anche che la società non era a conoscenza di tale utilizzo da parte di OpenAI.
Tuttavia, il rapporto afferma che c’erano persone in Google che lo sapevano ma non hanno intrapreso alcuna azione contro OpenAI perché Google utilizzava video di YouTube per addestrare i suoi modelli di intelligenza artificiale. Google ha detto Ora Lo fa solo con i video dei creatori di contenuti che hanno accettato. Engadget ha contattato Google e OpenAI per un commento.
IL Ora Il rapporto afferma inoltre che Google ha chiesto a un team di modificare la propria politica sulla privacy nel giugno 2023 per coprire l’uso di contenuti più ampi disponibili al pubblico, inclusi Google Docs e Fogli Google, per addestrare i suoi modelli e prodotti di intelligenza artificiale. Le modifiche, che secondo Google sono state apportate per chiarezza, sono state pubblicate a luglio. ha detto Bryant Ora Questo tipo di dati viene utilizzato solo con il permesso degli utenti che si sono iscritti ai test delle funzionalità beta di Google e la società “non ha iniziato la formazione su ulteriori tipi di dati in base a questo cambio di linguaggio”. La modifica ha aggiunto Bard come esempio di come possono essere utilizzati questi dati.
Correzione, 6 aprile 2024, 15:45 ET: Questa storia originariamente riportava che Google aveva aggiornato la sua politica sulla privacy nel giugno 2022. L'aggiornamento della politica è stato effettivamente effettuato nel 2023. Ci scusiamo per l'errore.