Meta Hadirkan Alat Penerjemahan dalam 100 Bahasa
Meta memperkenalkan model penerjemahan dan transkripsi AI untuk 100 bahasa.
REPUBLIKA.CO.ID, JAKARTA – Raksasa teknologi global terus berlomba merilis berbagai fitur dengan memanfaatkan kecerdasan buatan (AI). Kini, perusahaan milik Mark Zuckerberg, Meta, memperkenalkan model penerjemahan dan transkripsi AI untuk 100 bahasa yang berbeda di seluruh dunia.
Disebut sebagai “SeamlessM4T”, model tunggal ini dapat melakukan penerjemahan dari ucapan-ke-teks, ucapan-ke-ucapan, teks-ke-ucapan, dan teks-ke-teks. Ini tentunya bisa menjadi terobosan untuk mempermudah komunikasi antar individu atau kelompok yang beda bahasa.
SeamlessM4T mendukung pengenalan suara untuk hampir 100 bahasa, terjemahan suara-ke-teks untuk hampir 100 bahasa input dan output, terjemahan suara-ke-ucapan, dan mendukung hampir 100 bahasa input serta 36 bahasa output termasuk bahasa Inggris. Selain itu model tersebut juga bisa melakukan terjemahan teks-ke-teks untuk hampir 100 bahasa.
"Kami juga merilis metadata SeamlessAlign, dataset terjemahan terbesar hingga saat ini, dengan total 270 ribu jam penyelarasan ucapan dan teks yang telah disetujui," ujar Meta dalam sebuah pernyataan seperti dilansir Siasat Daily, Rabu (23/8/2023).
Tahun lalu, Meta merilis No Language Left Behind (NLLB), sebuah model penerjemahan mesin teks-ke-teks yang mendukung 200 bahasa, dan telah diintegrasikan ke dalam Wikipedia sebagai salah satu penyedia terjemahan.
"Kami juga membagikan demo dari Universal Speech Translator kami, yang merupakan sistem penerjemahan langsung dari ucapan ke ucapan pertama untuk bahasa Hokkien, bahasa yang tidak memiliki sistem tulisan yang digunakan secara luas," ungkap perusahaan tersebut.
Awal tahun ini, Meta juga merilis Massively Multilingual Speech, yang menyediakan teknologi pengenalan suara, identifikasi bahasa, dan sintesis suara di lebih dari 1.100 bahasa.
Menurut Meta, 'SeamlessM4T' memanfaatkan temuan dari semua proyek ini untuk memungkinkan pengalaman penerjemahan multibahasa dan multimodal yang berasal dari satu model, yang dibangun di berbagai sumber data lisan dengan hasil yang canggih.