1. Buka konten
  2. Buka menu utama
  3. Buka situs DW lainnya

Terjemahan Online Dobrak Kendala Bahasa

Diana Fong27 Desember 2012

Google dan layanan terjemahan di internet memberi akses teks bahasa apapun bagi pengguna. Kualitas terjemahannya ada yang mengesankan hingga tak dapat dipahami. Namun terus membaik berkat data dan algoritme.

https://p.dw.com/p/179gD
Foto: Fotolia© Moritz Wussow #28634951

Internet menghubungkan dunia. Tapi banyak yang tak dapat berkomunikasi satu sama lain karena kendala bahasa. Sehingga mesin terjemahan online gratis seperti Google Translate, Bing keluaran Microsoft dan Systran diibaratkan mukjizat.

Lebih dari 200 juta pengguna di dunia mengakses Google Translate setiap bulan, menurut Franz Josef Och yang mengepalai kelompok mesin penerjemah Google.

"Hampir semua terjemahan di dunia kini dikerjakan oleh Google Translate," tulisnya dalam blog perusahaan awal tahun ini.

Tetap saja, Och harus mengakui tantangan yang dihadapi dalam menghasilkan teks terjemahan mesin yang mampu dipahami. Ia yakin masih banyak hambatan yang harus diatasi.

"Jika situsnya dalam bahasa Perancis dan anda tidak mampu berbicara Perancis, terjemahan mesin tidak senyaman terjemahan manusia, namun masih bisa dipahami," jelasnya kepada DW.

"Selamat Natal dan meluncur dengan baik di tahun baru."
"Selamat Natal dan meluncur dengan baik di tahun baru."Foto: picture-alliance/dpa

Bersangkutan dengan probabilitas

Google Translate mengangkat terjemahan manusia ke dunia maya dan menggunakan algoritme statistika untuk menghitung padanan yang paling memungkinkan antara dua teks paralel dalam sebuah padanan bahasa.

Metode ini didasarkan pada terobosan dalam mesin terjemahan yang dikembangkan oleh tim ahli fisika IBM pada tahun 1990-an. Pesaing Google, Bing keluaran Microsoft, juga menggunakan metode yang sama.

Contoh yang baik mengenai cara kerja Google dan Bing adalah terjemahan ucapan Natal dalam bahasa Jerman, "Wir wünschen Euch ein frohes Weihnachtsfest und einen guten Rutsch ins neue Jahr!"

Google dan Bing menghasilkan, "We wish you a Merry Christmas and a Happy New Year!" atau "Kami mengucapkan Selamat Natal dan Tahun Baru!"

Namun Systran, salah satu sistem mesin terjemahan, menghasilkan terjemahan yang janggal, "We wish you a glad Christmas and a good slide in the new year!" atau "Kami mengucapkan Selamat Natal dan meluncur dengan baik di Tahun Baru!"

Hasil dari Google dan Bing adalah yang paling memungkinkan – keduanya mengalahkan kecocokan lain yang ditemukan pada bank data kedua mesin pencari di dunia maya itu.

Kesalahan kecil dalam terjemahan dari bahasa Cina ke Inggris berujung pada perbedaan besar
Kesalahan kecil dalam terjemahan dari bahasa Cina ke Inggris berujung pada perbedaan besarFoto: Grahm Mathew Balkany, AIA

Salah satu keunggulan utama mesin terjemahan dibandingkan sistem yang didasarkan pada aturan linguistik adalah memberikan pengguna lebih banyak kontrol atas hasil. Setidaknya menurut Aljoscha Burchardt, seorang ahli mesin terjemahan dari Pusat Riset Jerman untuk Kecerdasan Buatan (DFKI) di Berlin.

"Anda tahu apa yang dilakukan sistem yang berdasarkan aturan, tapi kemudian anda membutuhkan para ahli untuk memasuki sebuah domain subjek baru, yang memerlukan sebuah leksikon baru dan cara baru untuk mengkonstruksi kalimat," ungkap Burchardt kepada DW.

Hal ini berbeda pada sistem yang berdasarkan probabilitas seperti Google dan Bing.

"Domain subjek tertentu memberikan hasil yang baik, seperti debat parlemen dengan banyak sekali teks yang diterjemahkan kalangan profesional dari Uni Eropa atau PBB dapat dijumpai dalam banyak kombinasi bahasa," ujar Burchardt.

Masalah pada Google Translate

Kualitas output Google turun secara drastis pada wilayah subjek seperti ilmu hewan atau berburu yang ketersediaan teks terjemahan teksnya tergolong langka, menurut catatan Burchardt.

Namun yang lebih parah adalah fakta bahwa begitu banyak kata ambigu yang memiliki makna ganda atau lebih, dan sangat bergantung pada konteks.

Dengan kata 'bank,' seseorang dapat merujuk pada 'savings bank' atau 'bank tabungan' maupun 'river bank' atau 'tepian sungai.' Pengguna tidak dapat memastikan bahwa Google akan memilih 'tepian sungai' untuk teks berburu, seperti "The ducks emerged from the river and the hunter could see them by the bank" atau "Bebek-bebek keluar dari sungai dan sang pemburu bisa melihat mereka di tepian."

Kualitas terjemahan tergantung pada jumlah data padanan yang tersedia
Kualitas terjemahan tergantung pada jumlah data padanan yang tersediaFoto: picture-alliance / Thomas Urner

Statistika terjemahan mesin bergantung pada miliaran teks terjemahan untuk mencari padanan kata dalam sepersekian detik.  PBB serta Uni Eropa adalah sumber utama untuk terjemahan profesional berkualitas. Tapi banyak juga terjemahan buruk yang dibuat oleh manusia atau mesin yang bisa ditemukan di dunia maya. Sebuah mesin tidak dapat menilainya dengan baik.

Parahnya lagi, Google tidak bisa membedakan antara terjemahan manusia dan terjemahan yang dihasilkan sistemnya sendiri.

"Banyak orang yang menaruh hasil terjemahan Google Translate di dunia maya. Jadinya sistem kami 'belajar' dari terjemahan kami sendiri. Sesuatu yang tentunya tidak kami inginkan," tandas Och dari Google.

Timnya tengah mengerjakan algoritme untuk menyortir terjemahan mesin yang buruk.

Google juga berupaya memperbaiki terjemahan dengan bantuan para pengguna yang cenderung menerjemahkan teks ke dalam bahasa ibu mereka. Sebuah fitur baru mengajak pengguna memilih terjemahan yang lebih baik di antara dua atau lebih opsi.

"Bagusnya orang-orang punya akal sehat yang membantu mereka menggunakan Google Translate, karena jika formulasinya terasa janggal, anda tetap bisa mengerti apa yang dimaksud," bela Och.