REPUBLIKA.CO.ID, JAKARTA — ChatGPT, chatbot revolusioner yang ditenagai oleh kecerdasan buatan (AI), akan segera bisa melakukan hal-hal lebih dari sekadar mengirim pesan teks. Seorang eksekutif Microsoft mengungkapkan bahwa versi terbaru ini akan bisa mengubah teks menjadi video unik.
Microsoft telah banyak berinvestasi di ChatGPT dan telah meluncurkan sejumlah produk baru yang menggabungkannya sebagai asisten AI, seperti mesin pencari Bing. Versi yang diperbarui ini dijuluki GPT-4, dan diperkirakan akan diluncurkan pada Kamis (16/3/2023).
Menurut CTO Microsoft Jerman Andreas Braun, GPT-4 akan memiliki 'model multimodal'. Artinya, GPT-4 akan bisa menghasilkan teks menjadi konten dalam berbagai format, seperti klip audio, gambar, dan klip video.
Dilansir dari Daily Mail, Rabu (15/3/2023), ChatGPT adalah model bahasa besar yang telah dilatih pada data teks dalam jumlah besar, yang memungkinkannya menghasilkan respons teks seperti manusia, terhadap perintah yang diberikan. Versi saat ini dirilis oleh rintisan OpenAI pada November 2022, dikenal sebagai GPT-3.5.
GPT-3.5 ternyata memiliki banyak kemampuan, misalnya, telah digunakan untuk lulus ujian, menyampaikan khotbah, menulis perangkat lunak, dan memberikan saran tentang hubungan. Namun ini terbatas pada memberikan tanggapan dalam bentuk teks.
Pada acara AI in Focus - Digital Kickoff Kamis pekan lalu, Braun mengungkapkan bahwa itu semua akan berubah. “Kami akan memperkenalkan GPT-4 pekan depan. Di sana kami akan memiliki model multimodal yang akan menawarkan sesuatu yang benar-benar berbeda,” ujar Braun saat itu.
Untuk diketahui, ChatGPT bukanlah sesuatu yang baru, sebelumnya Meta sudah meluncurkan Make-A-Video yakni sistem AI yang bisa mengubah teks menjadi video. Sayangnya, klip yang dihasilkan cenderung buram dan kurang suara, Make-A-Video juga belum tersedia untuk umum.
Lalu pada 2020, OpenAI juga mengumumkan Jukebox, alat yang membuat musik dari prompt dan dapat meniru gaya artis yang berbeda. Meskipun tidak menyebutkan alat-alat lain secara spesifik, Braun mengatakan bahwa ChatGPT versi terbaru akan membuat model menjadi komprehensif.
CEO OpenAI Sam Altman mengatakan GPT-4 akan lebih baik dalam menghasilkan kode komputer, menangani permintaan teks lebih lama dan dapat menampilkan teks, gambar, suara, dan video. “Saya rasa kita akan segera mendapatkan model multimodal, dan itu akan membuka hal-hal baru,” kata dia dalam AI in Focus juga.
Meskipun AI multi-modal yang komprehensif adalah konsep baru, diskusi tentang dampak pembuatan video AI telah berlangsung selama bertahun-tahun, khususnya terkait 'deepfakes'.
Deepfakes adalah bentuk AI yang menggunakan pembelajaran mendalam untuk memanipulasi audio, gambar, atau video, membuat konten media yang hiper-realistis, tetapi palsu.
Istilah ini diciptakan pada 2017 ketika pengguna Reddit mengunggah video porno yang dimanipulasi ke forum. Video itu menukar wajah selebritas seperti Gal Gadot, Taylor Swift, dan Scarlett Johansson, menjadi bintang porno.
Contoh terkenal lain dari deepfake atau 'cheapfake' adalah tiruan kasar Volodymyr Zelensky yang tampak menyerah kepada Rusia, dalam sebuah video yang beredar luas di media sosial Rusia tahun lalu.
Klip itu menunjukkan presiden Ukraina berbicara dari mimbar ketika dia meminta pasukannya untuk meletakkan senjata mereka dan menyetujui pasukan penyerang Putin.
Pengguna internet yang cerdas segera menandai ketidaksesuaian antara warna leher dan wajah Zelensky, aksen aneh, dan pikselasi di sekitar kepalanya.
Terlepas dari nilai hiburan deepfake, beberapa ahli telah memperingatkan tentang bahaya yang mungkin mereka timbulkan. Direktur Cyber Security Research Group di King's College London, Inggris, Dr Tim Stevens, mengatakan AI deepfake berpotensi merusak institusi demokrasi dan keamanan nasional.
Dia mengatakan ketersediaan alat ini secara luas dapat dimanfaatkan oleh negara-negara seperti Rusia untuk 'menjebak' populasi sasarannya, dalam upaya mencapai tujuan kebijakan luar negeri dan 'merusak' keamanan nasional negara. “Ada potensi untuk AI dan deepfake untuk mempengaruhi keamanan nasional,” kata dia.
Pada umumnya, ini dapat merusak kepercayaan pada institusi demokrasi dan media. Mereka dapat dieksploitasi oleh otokrasi seperti Rusia, untuk menurunkan tingkat kepercayaan pada institusi dan organisasi tersebut. Memang, diprediksi bahwa 90 persen konten daring akan dihasilkan atau dibuat menggunakan AI pada 2025.