REPUBLIKA.CO.ID, JAKARTA -- Fasilitas teknologi yang mengenali suara manusia semakin berkembang baik seperti Siri, Alexa, dan Cortana. Namun, ponsel pintar dan komputer supercanggih pun belum dapat mengenali suara alam.
Karenanya, para ilmuwan dari Massachusetts Institute of Technology (MIT) mencari cara untuk menemukan solusinya. Dilaporkan laman Phys, tim dari Computer Science and Artificial Intelligence Laboratory (CSAIL) di MIT merintis penelitian yang memungkinkan komputer mengenali suara alam.
Biasanya, dibutuhkan anotasi tangan manusia untuk 'mengajarkan komputer' bagaimana mengenali dan mengidentifikasi suara tertentu pada database suara berskala besar. Alih-alih demikian, tim ilmuwan menggunakan metode baru yang menghilangkan unsur manusia yaitu dengan menggunakan video.
"Visi komputer telah berkembang begitu baik sehingga bisa ditransfer ke domain lain. Kami memanfaatkan sinkronisasi antara visi dan suara tersebut dan meningkatkan skalanya dengan terpaan banyak video tanpa label agar komputer dapat memahami suara," tutur Carl Vondrick, salah satu anggota tim.
Sistem baru itu pada dasarnya memanfaatkan kemampuan komputer untuk mengenali informasi visual. Pengenalan itu lantas dikaitkan dengan pemahaman atas suara yang dihasilkan video.
Dengan kata lain, komputer diprogram untuk mengenali objek dalam video dan mencari korelasi antara penampilan benda-benda dan informasi suara yang diproses. Menurut Vondrick, cara tersebut jauh lebih cepat, lebih mudah, dan lebih akurat untuk melatih komputer mengenali suara.
Berdasarkan penghitungan, tingkat akurasinya sekira 13 hingga 15 persen lebih tinggi dibandingkan metode anotasi. Selanjutnya, kesimpulan tim peneliti CSAIL ini akan dipresentasikan pada konferensi Neural Information Processing Systems yang berlangsung awal Desember.