Perubahan iklim bukan lagi sekadar prediksi masa depan, melainkan realitas yang kita rasakan sehari-hari. Mulai dari suhu udara yang kian menyengat, banjir bandang yang tak menentu, hingga pergeseran musim tanam yang membingungkan para petani kita. Namun, di tengah mendesaknya kebutuhan akan aksi nyata, ada tantangan besar lain yang mengintai di dunia digital: hoaks dan misinformasi perubahan iklim.
Di Indonesia, obrolan seputar isu lingkungan sering kali dikaburkan oleh informasi palsu. Ada yang menyebutkan bahwa pemanasan global hanyalah konspirasi, ada pula yang menyebarkan klaim keliru tentang penyebab bencana alam. Dampaknya fatal. Masyarakat menjadi skeptis, ragu untuk bertindak, dan kebijakan penyelamatan lingkungan menjadi sulit mendapat dukungan penuh.
Celakanya, pembuat hoaks sangat pintar. Mereka tidak hanya menyebarkan berita bohong dalam bahasa Indonesia baku, tetapi juga masuk melalui bahasa-bahasa daerah yang lebih dekat di hati masyarakat. Di sinilah letak masalah besarnya (gap): kita kekurangan perangkat digital atau sumber daya kebahasaan (linguistic resources) untuk mendeteksi hoaks dalam bahasa daerah. Akibatnya, sistem penyaring hoaks konvensional sering kali “lolos” saat membaca teks di luar bahasa Indonesia resmi.
Mengenal NusaClimate: Senjata Baru Melawan Hoaks
Melihat celah kritis tersebut, sekelompok peneliti dari Indonesia AI Institute (IAII) mengembangkan riset untuk menghasilkan sebuah solusi inovatif bernama NusaClimate.
NusaClimate adalah kumpulan data raksasa (corpus) multibahasa pertama yang sengaja dibuat untuk mendeteksi sikap atau posisi (stance) masyarakat terhadap isu perubahan iklim. Dataset ini mengumpulkan 50.613 data teks yang mencakup empat bahasa sekaligus:
- Bahasa Indonesia
- Bahasa Minangkabau
- Bahasa Bali
- Bahasa Bugis
Kehadiran tiga bahasa daerah (Minangkabau, Bali, dan Bugis) menjadi sangat penting karena ketiganya tergolong sebagai bahasa yang minim sumber daya digital (low-resource languages). Dengan NusaClimate, kecerdasan buatan (AI) kini punya “kamus” yang memadai untuk memahami konteks lokal secara mendalam.
Cara Kerja Teknologi dan Eksperimen yang Dilakukan
Bagaimana data sebanyak itu diolah menjadi sistem pembasmi hoaks? Jawabannya terletak pada teknologi bernama Encoder-based Language Model (Model Bahasa Berbasis Enkoder).
Bayangkan sistem ini seperti seorang detektif bahasa yang sangat peka. Ketika ada sebuah klaim baru yang beredar di media sosial, AI akan melakukan perbandingan semantik (makna kata). Sistem akan mencocokkan klaim tersebut dengan premis (fakta sains atau data valid yang ada di dalam dataset NusaClimate), meskipun keduanya ditulis dalam bahasa daerah yang berbeda (cross-lingual).
Melalui kerangka kerja ini, para peneliti IAII sedang dalam tahap membangun alat pengecek misinformasi iklim secara real-time yang bisa digunakan oleh masyarakat luas untuk langsung menyaring mana berita yang valid dan mana yang hoaks saat itu juga.
Mengapa AI Harus “Dilatih” Lagi?
Untuk memastikan AI ini bekerja dengan cerdas, para peneliti IAII melakukan proses yang disebut Fine-Tuning (penyelarasan akhir). Mengapa ini penting?
Model AI dasarnya sudah pintar membaca bahasa secara umum, tetapi mereka perlu “dilatih” lagi secara spesifik agar paham istilah-istilah ilmiah lingkungan dan slang lokal terkait iklim. Dalam eksperimen ini, para peneliti IAII menguji tiga model bahasa raksasa yang populer:
- IndoBERT (dari IndoNLU) – Sangat jago memahami struktur bahasa Indonesia formal.
- IndoBERT-Nusa – Versi yang sudah ditingkatkan untuk memahami variasi bahasa di nusantara.
- XLM-RoBERTa Large – Model multibahasa internasional yang kuat dalam menjembatani makna antarbahasa yang berbeda.
Eksperimen dilakukan lewat metode supervised fine tuning (pembelajaran terpandu), di mana AI dilatih menggunakan pengaturan parameter (hyperparameters) yang optimal untuk dua tugas utama: mendeteksi sikap teks terhadap misinformasi iklim, serta mengelompokkan topik dan subtopik seputar isu lingkungan tersebut.
~Riset ini sedang berjalan.