Ilmuwan Ciptakan 'Mesin Waktu' Otomatis untuk Merekonstruksi Bahasa-bahasa Kuno

'Pohon genealogis' Proto-Austronesia (Credit: Image courtesy of University of California - Berkeley))
Feb. 11, 2013 —Bahasa-bahasa kuno mengandung harta karun informasi tentang budaya, politik dan perdagangan dalam   milenia yang lalu. Namun, merekonstruksi bahasa-bahasa tersebut untuk mencari petunjuk-petunjuk akan  sejarah manusia menghendaki kerja keras selama bertahun-tahun. Kini, para ilmuwan di Universitas California, Berkeley, telah menciptakan sebuah “mesin waktu,” otomatis atau sejenisnya, yang akan mengakselerasi dan memperbaiki proses rekonstruksi ratusan bahasa-bahasa kuno tersebut secara besar-besaran.

Dalam sebuah contoh menarik tentang betapa penelitian dengan menggunakan mesin dan “data yang besar” mulai mempunyai dampak yang signifikan dalam sebuah facet pengetahuan, para peneliti dari UC Berkeley dan University of British Columbia telah menciptakan sebuah program komputer yang bisa dengan cepat merekonstruksi “proto-bahasa-bahasa”—nenek moyang lingusitik dari mana semua bahasa modern berasal. Bahasa-bahasa kuno permulaan ini termasuk bahasa Proto-Indo-Eropa, Proto-Afroasiatik dan, dalam hal ini, Proto-Austronesia, yang telah menyebabkan kebangkitan bahasa-bahasa yang digunakan di Asia Tenggara, sebagian Asia kontinental, Australasia dan Pasifik.

Apa yang membuat saya tertarik akan sistem ini adalah bahwa sistem tersebut mengandung begitu banyak ide-ide besar dari para ahli linguistik tentang rekonstruksi historis, dan sistem tersebut mengotomatisasi ide-ide besar tersebut pada skala yang baru; lebih banyak data, lebih banyak kata, lebih banyak bahasa, namun lebih sedikit waktu,” kata Dan Klein, seorang associate professor ilmu komputer di UC Berkeley dan co-author dari paper yang diterbitkan secara online pada tanggal 11 Februari di dalam jurnal Proceedings of the National Academy of Sciences.

Model komputasional milik tim riset tersebut menggunakan model penalaran probabilistik (probabilistic reasoning)—yang mengeksplorasi mantik dan statistik untuk memperkirakan hasil—untuk merekonstruksi lebih dari 600 bahasa-bahasa Proto-Austronesia dari database yang ada yang terdiri dari lebih dari 140.000 kata, yang mampu mereplikasikan apa yang telah dilakukan para ahli bahasa sebelumnya secara manual dengan akurasi 85 persen. Sementara rekonstruksi secara manual masih merupakan sebuah proses yang njelimet yang bisa memakan waktu selama bertahun-tahun, sistem ini bisa melakukan sebuah rekonstruksi berskala besar hanya dalam hitungan hari atau bahkan jam, kata para peneliti.

Program ini tidak hanya akan mempercepat kemampuan para ahli bahasa untuk membangun kembali proto-bahasa-bahasa dunia dalam skala besar, dengan cara meningkatkan pemahaman kita akan budaya kuno berdasarkan kosa-kata dalam bahasa-bahasa mereka, tetapi juga bisa menyediakan clues tentang bagaimana bahasa-bahasa bisa berubah mulai sekarang.

“Model statistik kami bisa digunakan untuk menjawab pertanyaan-pertanyaan ilmiah tentang bahasa dari waktu ke waktu, tidak hanya untuk membuat simpulan-simpulan tentang masa silam, tetapi juga untuk mengeksplorasi bagaimana bahasa bisa berubah di masa yang akan datang,” kata Tom Griffiths, associate professor psikologi, direktur Laboratorium Ilmu Kognitif Komputasional di UC Berkeley dan seorang co-author dari paper tersebut. 

Penemuan tersebut telah membawa misi UC Berkeley selangkah lebih maju dalam hal pemahaman akan sebuah data besar dan dalam penggunaan teknologi baru untuk mendokumentasi dan memelihara bahasa-bahasa yang terancam punah sebagai sumber-sumber yang penting untuk pelestarian budaya dan ilmu pengetahuan. Sebagai contoh, para peneliti berencana untuk menggunakan model komputasional yang sama untuk merekonstruksi proto-bahasa-bahasa Amerika Utara.

Tulisan-tulisan kuno dari manusia tertanggal kurang dari 6.000 tahun silam, lama setelah kemunculan banyak proto-bahasa-bahasa. Sementara para arkeolog menangkap adanya tanda-tanda dari bahasa-bahasa kuno dalam bentuk tertulis, para ahli bahasa secara khas menggunakan apa yang dikenal sebagai “metode komparatif” untuk menjajaki masa lalu. Metode ini membangun hubungan antara bahasa-bahasa, mengidentifikasi bunyi-bunyi yang berubah secara tidak beraturan seiring berjalannya waktu untuk menentukan apakah bahasa-bahasa tersebut mempunyai bahasa ibu yang sama.

“Untuk memahami bagaimana sebuah bahasa berubah—yang bunyi-bunyinya lebih cenderung berubah dan akan menjadi apa perubahan itu nantinya—memerlukan rekonstruksi dan analisis bentuk-bentuk kata kuno dalam jumlah besar. Di sinilah rekonstruksi-rekonsruksi otomatis memainkan peran pentingnya,” kata Alexandre Bouchard-Côté, seorang asisten profesor statistik di University of British Columbia dan pengarang kepala dalam studi gtersebut, yang dia mulai ketika dia masih mahasiswa pasca sarjana di UC Berkeley.

Model komputasional UC Berkeley ini didasarkan pada teori linguistik yang sudah mapan bahwa kata-kata berevolusi di sepanjang cabang-cabang sebuah pohon keluarga—menyerupai pohon genealogis—yang merefleksikan adanya hubungan-hubungan linguistik yang berevolusi seiring waktu, dengan akar-akar dan simpul-simpul yang merepresentasikan proto-bahasa-bahasa dan daun-daun yang merepresentasikan bahasa-bahasa modern.

Dengan menggunakan sebuah algoritma yang dikenal sebagai rantai Markov sampler Monte Carlo (Markov chain Monte Carlo sampler), program tersebut memilah-milah beberapa rumpun bahasa (cognates), kata-kata dalam bahasa-bahasa berbeda yang mempunyai bunyi yang sama, sejarah dan asal-usul yang sama, untuk mengkalkulasi kemungkinan bahwa rumpun bahasa tertentu atau kata-kata tertentu berasal dari proto-bahasa tertentu. Pada masing-masing tahap, algoritma tersebut menyimpan sebuah rekonstruksi yang mengandung hipotesis untuk masing-masing rumpun bahasa (cognate) dan untuk masing-masing bahasa leluhur. 

“Karena bunyi berubah dan rekonstruksi-rekosntruksi terkait erat dengan perubahan itu, maka sistem kita menggunakan perubahan-perubahan itu untuk secara berulang-ulang saling memperbaiki satu sama lain,” kata Klein. “Sistem tersebut pertama kali memperbaiki perubahan-perubahan bunyi perkiraannya dan mengurangi rekonstruksi-rekonstruksi yang lebih baik dari bentuk-bentuk kuno tersebut. Sistem tersebut kemudian memperbaiki rekonstruksi-rekonstruksi tersebut dan menganalisis kembali perubahan-perubahan bunyi tersebut. Langkah-langkah ini dilakukan berulang-ulang, dan kedua prediksi tersebut secara perlahan akan menjadi lebih baik ketika struktur dasar-nya muncul seiring waktu.  

Share this story on Facebook, Twitter, and Google:

http://www.sciencedaily.com/releases/2013/02/130212112025.htm

comment 0 comments:

Post a Comment

 
© Hasim's Space | Design by Blog template in collaboration with Concert Tickets, and Menopause symptoms
Powered by Blogger