REPUBLIKA.CO.ID, JAKARTA -- Penelitian terbaru dari Google kini memungkinkan bahasa isyarat untuk diubah dalam bahasa dalam panggilan video. Google mengembangkan mesin pendeteksi bahasa isyarat secara waktu nyata yang dapat mengetahui kapan seseorang mulai dengan bahasa isyarat dan kapan mereka selesai (tidak hanya mendeteksi suara).
Sistem tersebut dimungkinkan dengan latensi yang sangat kecil, menurut laporan TechCrunch, dikutip Senin (5/10). Latensi berpengaruh besar untuk deteksi bahasa isyarat agar video tidak tertunda atau kualitasnya terdegradasi.
Google membuat sistem yang ringan dan dapat diandalkan. Sistem tersebut pertama-tama menjalankan video model yang dinamai PoseNet, yang dapat memperkirakan posisi tubuh dan anggota badan.
Informasi visual yang disederhanakan ini (pada dasarnya dengan garis) dikirim ke sistem yang dilatih data pose dari video orang yang menggunakan Bahasa Isyarat Jerman. Kemudian membandingkan gambar langsung dengan tampilan garis yang dihasilkan dari gerakan.
Proses sederhana ini sudah menghasilkan akurasi 80 persen dalam memprediksi apakah seseorang menggunakan bahasa isyarat atau tidak, dan dengan beberapa pengoptimalan tambahan mendapatkan akurasi hingga 91,5 persen. Dibandingkan dengan bagaimana deteksi "ucapan aktif" pada sebagian besar panggilan video hanya dapat mengetahui apakah seseorang berbicara. Bahkan tidak tidak bisa membedakan batuk, angka-angka tersebut terbilang cukup baik.
Untuk bekerja tanpa menambahkan sinyal "seseorang sedang menggunakan bahasa isyarat" ke dalam panggilan. Sistem ini menggunakan trik cerdas, dengan menggunakan sumber audio virtual untuk menghasilkan nada 20kHz, yang berada di luar jangkauan pendengaran manusia, namun diperhatikan oleh sistem audio komputer.
Sinyal ini dihasilkan setiap kali orang tersebut menggunakan bahasa isyarat, membuat algoritme deteksi ucapan "berpikir" bahwa mereka sedang berbicara dengan suara keras. Saat ini, sistem tersebut masih dalam tahap demo.