REPUBLIKA.CO.ID, JAKARTA -- Menurut laporan baru, perusahaan-perusahaan kecerdasan buatan (AI) seperti OpenAI, Google, dan Meta telah menggunakan taktik yang tidak jelas. Ini dalam upaya mengamankan data berkualitas tinggi untuk melatih model AI mereka.
Dilansir Neowin, Senin (8/4/2024), laporan New York Times menyatakan bahwa OpenAI konon telah mentranskripsikan lebih dari satu juta jam video YouTube untuk menerapkan data guna melatih model bahasa besar (LLM) tercanggihnya, GPT-4.
Kabarnya, OpenAI mengembangkan model transkripsi audio Whisper, yang membantu perusahaan dalam mengambil data dari video YouTube. New York Times melaporkan bahwa OpenAI mengetahui bahwa metode ini mungkin akan diawasi, namun mereka tetap melanjutkannya karena mereka yakin metode ini merupakan penggunaan wajar. Menariknya, Google, pemilik YouTube, juga diduga terlibat dalam praktik serupa pada model-model AI-nya, sehingga melanggar hak cipta pembuatnya.
Laporan New York Times sejalan dengan laporan The Information, yang menyoroti bahwa OpenAi diduga menghapus data dari video dan podcast YouTube untuk melatih dua sistem AI-nya. Laporan tersebut juga menunjukkan bahwa presiden OpenAI, Greg Brockman, juga ada dalam tim tersebut.
Ketika CEO YouTube Neil Mohan diwawancarai oleh Bloomberg, dia mengatakan bahwa kebijakan perusahaan “tidak mengizinkan pengunduhan hal-hal seperti transkrip-transkrip atau bit-bit video, dan itu jelas merupakan pelanggaran terhadap persyaratan layanan kami.” Namun, ketika ditanya apakah data YouTube digunakan oleh OpenAI atau tidak, Mohan memberikan jawaban yang ambigu, dengan mengatakan, “Saya telah melihat laporan bahwa data tersebut mungkin digunakan atau tidak. Saya sendiri tidak memiliki informasi.”
Laporan New York Times lebih lanjut mengklaim bahwa beberapa orang di Google mengetahui praktik OpenAI dalam menyalin data YouTube, namun mereka tidak dapat berbuat apa-apa karena Google juga menggunakan praktik yang sama untuk melatih model AI-nya sendiri. Namun Google mengatakan kepada New York Times bahwa mereka melakukan pengikisan data video hanya setelah pembuat video tersebut memberikan persetujuannya.
Berdasarkan laporan tersebut, diklaim bahwa Google meminta tim untuk “mengubah kebijakan privasinya” pada Juni 2023, “agar Google dapat memanfaatkan Google Docs yang tersedia untuk umum, ulasan-ulasan restoran di Google Maps, dan materi daring lainnya untuk informasi lebih banyak tentang produk-produk AI.”