REPUBLIKA.CO.ID, JAKARTA -- Sebuah model kecerdasan buatan (AI) dapat mendeteksi lokasi tertentu hanya dengan melihat beberapa foto dari Google Street View. AI dengan tingkat akurasi mengesankan itu dikembangkan oleh mahasiswa pascasarjana dari Universitas Stanford.
Dikutip dari laman ZDNET, Rabu (3/1/2024), aplikasi itu bernama Pigeon, atau Predicting Image Geolocations. Pigeon dapat memprediksi negara dalam gambar dengan akurasi 92 persen dan dapat menentukan lokasi dalam jarak 25 kilometer dari lokasi target dengan lebih dari 40 persen tebakannya.
Pigeon berada di peringkat 0,01 persen teratas pemain GeoGuessr. Itu adalah permainan di mana pengguna menebak lokasi foto yang diambil dari Google Street View dari lokasi tersebut. Game itu menjadi cikal bakal proyek Pigeon.
Selain itu, Pigeon juga mengalahkan salah satu pemain GeoGuessr profesional terbaik dunia, Trevor Rainbolt, dalam rangkaian enam pertandingan yang disiarkan secara online dengan lebih dari 1,7 juta penayangan.
Agar Pigeon bisa bekerja dengan baik, para mahasiswa memanfaatkan CLIP, jaringan saraf yang dikembangkan oleh OpenAI yang dapat menghubungkan teks dan gambar dengan melatihnya pada nama-nama kategori visual yang akan dikenali. Kemudian, terinspirasi oleh GeoGuessr, Pigeon dilatih pada kumpulan data 100 ribu lokasi asli yang diambil sampelnya secara acak dari GeoGuessr.
Kumpulan unduhan empat gambar digunakan untuk menjangkau keseluruhan "panorama" di lokasi tertentu, sehingga menghasilkan total 400 ribu gambar. Dibandingkan dengan jumlah gambar yang dilatih oleh model AI lain, angka yang dipapar pada Pigeon cukup rendah.
Sebagai perbandingan, model penghasil gambar OpenAI yang populer, DALL-E 2, dilatih pada ratusan juta gambar. Para mahasiswa juga mengerjakan model terpisah yang disebut Pigeotto, yang dilatih pada lebih dari empat juta foto yang berasal dari Flickr dan Wikipedia untuk mengidentifikasi lokasi dari satu gambar sebagai masukan.
Kinerja Pigeotto mencapai hasil yang mengesankan pada tolok ukur geolokalisasi gambar, mengungguli hasil canggih sebelumnya hingga 7,7 persen dalam akurasi kota dan 29,8 persen dalam akurasi negara. Ulasan aplikasi dalam makalah membahas pertimbangan etis yang terkait dengan model ini, termasuk manfaat dan risikonya.
Di satu sisi, geolokalisasi gambar memiliki banyak kegunaan positif, seperti mengemudi otonom, investigasi visual, dan sekadar memuaskan rasa ingin tahu tentang lokasi pengambilan foto. Namun, ada juga dampak negatifnya seperti pelanggaran privasi. Pertimbangan itu membuat para mahasiswa tidak merilis model AI tersebut ke publik melainkan hanya merilis kode untuk validasi akademis.