Bandung Side, Taman Sari – Pelestarian bahasa daerah menjadi kerja bareng antara GIZ Indonesia, Prosa.AI dan Bappenas RI dengan meluncurkan Dataset Tiga Bahasa daerah di Indonesia melalui pemanfaatan teknologi digital, Artificial Intelligence (AI).
Indonesia, dengan peringkat pengguna internet terbesar keempat di dunia terus bergerak maju dalam ranah teknologi, namun tantangan pelestarian bahasa daerah yang dihadapi dalam pengolahan bahasa masih menjadi fokus utama.
Meski demikian, langkah progresif telah diambil melalui kegiatan pembangunan data dan pembangunan model serta benchmark untuk 3 bahasa daerah yaitu Bugis, Bali, dan Minangkabau.
Kegiatan yang diselenggarakan oleh FAIR Forward – “Artificial Intelligence for All” yang dilaksanakan oleh GIZ Indonesia atas nama Kementerian Kerjasama Ekonomi dan Pembangunan Jerman (BMZ) bersama dengan Kementerian PPN/ BAPPENAS Republik Indonesia yang bertujuan membangun data bahasa daerah terbuka guna mendukung pengembangan teknologi yang berkelanjutan. Dalam pelaksanaanya kegiatan ini juga turut didukung oleh Prosa.Ai.
Pada kegiatan ini, tiga bahasa daerah penting dipilih untuk pembangunan data, yakni; Minangkabau, Bali, dan Bugis. Ketiga bahasa daerah ini dipilih atas dasar popularitas penggunaan serta representasi geografis yang luas di Indonesia.
Bahasa Bali mewakili wilayah Bali-Sasak-Sumbawa, sementara Minangkabau melambangkan wilayah Malayo-Chamic di Sumatera, dan Bahasa Bugis mewakili Sulawesi Selatan.
Realita bahasa daerah di Indonesia disampaikan oleh Dr. Eng. Ayu Purwariani, menurut catatan Pancawati, M.D (25 Maret 2022) dalam tulisannya di kompas.id dengan judul “Melestarikan Bahasa Daerah, Hidupkan “Jembatan” Antar Generasi”, yakni;
– Generasi Z-Milenial Muda (17-30 tahun): 7,5% menggunakan bahasa daerah, 63,5% menggunakan Campuran Bahasa Derah dan Bahasa Indonesia dan 28,3% Campuran Bahasa Indonesia dan Bahasa Asing.
– Milenial Matang (31-40 tahun): 20,2 % menggunakan bahasa daerah, 52,9% menggunakan Campuran Bahasa Derah dan Bahasa Indonesia dan 26,9% Campuran Bahasa Indonesia dan Bahasa Asing.
-Generasi X (41-52 tahun) 18,1% menggunakan bahasa daerah, 58,7% menggunakan Campuran Bahasa Derah dan Bahasa Indonesia dan 23,2% Campuran Bahasa Indonesia dan Bahasa Asing.
“Tampak pada data yang diperoleh oleh Pancawati, M.D., bahwa semakin sedikitnya penutur muda bahasa daerah, akibat dari minimnya regenerasi penggunaan bahasa daerah yang kemungkinan terjadi karena perpindahan penduduk,” ungkap Ayu Purwariani yang juga Co-Founder Of Prosa.AI.
Dalam rentang waktu 48 pekan, FAIR Forward berhasil mencapai target pembangunan data sebesar 10.000.000 kata. Proses ini melibatkan anotator remote dari masyarakat setempat dengan beragam latar belakang dialek dan jenis pekerjaan, memastikan representasi yang seimbang dari gender.
Dalam prosesnya, tambah Ayu, tentunya menghadapi tantangan seperti kesibukan dan kondisi eksternal seperti pemadaman listrik, proyek ini berhasil melalui berbagai hambatan dengan hasil yang memuaskan dalam upaya pelestarian bahasa daerah.
Selanjutnya, data yang terkumpul dianalisis dan dipublikasikan pada platform HuggingFace, memungkinkan akses yang mudah bagi pengembang dan masyarakat umum. Hasil dari pembangunan model juga menunjukkan peningkatan kinerja yang signifikan dibandingkan dengan model dasar sebelum adaptasi.
Melalui kegiatan ini, diharapkan masyarakat dan inovator AI lokal dapat memanfaatkan data bahasa daerah yang tersedia untuk membangun teknologi yang mendukung kebutuhan terkait bahasa daerah.
Selain itu, FAIR Forward juga berpotensi meningkatkan literasi digital sebagai langkah penting menuju transformasi digital yang lebih inklusif.***