'Pohon genealogis' Proto-Austronesia (Credit: Image courtesy of University of California - Berkeley)) |
Feb. 11, 2013 —Bahasa-bahasa kuno mengandung harta karun informasi tentang
budaya, politik dan perdagangan dalam milenia yang lalu. Namun, merekonstruksi bahasa-bahasa
tersebut untuk mencari petunjuk-petunjuk akan sejarah manusia menghendaki kerja keras selama
bertahun-tahun. Kini, para ilmuwan di Universitas California, Berkeley, telah
menciptakan sebuah “mesin waktu,” otomatis atau sejenisnya, yang akan mengakselerasi
dan memperbaiki proses rekonstruksi ratusan bahasa-bahasa kuno tersebut secara
besar-besaran.
Dalam sebuah contoh menarik tentang
betapa penelitian dengan menggunakan mesin dan “data yang besar” mulai
mempunyai dampak yang signifikan dalam sebuah facet pengetahuan, para peneliti dari UC Berkeley dan University of
British Columbia telah menciptakan sebuah program komputer yang bisa dengan
cepat merekonstruksi “proto-bahasa-bahasa”—nenek moyang lingusitik dari mana
semua bahasa modern berasal. Bahasa-bahasa kuno permulaan ini termasuk bahasa
Proto-Indo-Eropa, Proto-Afroasiatik dan, dalam hal ini, Proto-Austronesia, yang
telah menyebabkan kebangkitan bahasa-bahasa yang digunakan di Asia Tenggara,
sebagian Asia kontinental, Australasia dan Pasifik.
Apa yang membuat
saya tertarik akan sistem ini adalah bahwa sistem tersebut mengandung begitu
banyak ide-ide besar dari para ahli linguistik tentang rekonstruksi historis,
dan sistem tersebut mengotomatisasi ide-ide besar tersebut pada skala yang baru; lebih banyak
data, lebih banyak kata, lebih banyak bahasa, namun lebih sedikit waktu,” kata
Dan Klein, seorang associate professor ilmu komputer di UC Berkeley dan
co-author dari paper yang diterbitkan secara online pada tanggal 11
Februari di dalam jurnal Proceedings of the National Academy of Sciences.
Model komputasional milik tim riset
tersebut menggunakan model penalaran probabilistik (probabilistic reasoning)—yang mengeksplorasi mantik dan statistik
untuk memperkirakan hasil—untuk merekonstruksi lebih dari 600 bahasa-bahasa
Proto-Austronesia dari database yang ada yang terdiri dari lebih dari 140.000
kata, yang mampu mereplikasikan apa yang telah dilakukan para ahli bahasa
sebelumnya secara manual dengan akurasi 85 persen. Sementara rekonstruksi secara
manual masih merupakan sebuah proses yang njelimet
yang bisa memakan waktu selama bertahun-tahun, sistem ini bisa melakukan sebuah
rekonstruksi berskala besar hanya dalam hitungan hari atau bahkan jam, kata
para peneliti.
Program ini tidak hanya akan
mempercepat kemampuan para ahli bahasa untuk membangun kembali proto-bahasa-bahasa
dunia dalam skala besar, dengan cara meningkatkan pemahaman kita akan budaya
kuno berdasarkan kosa-kata dalam bahasa-bahasa mereka, tetapi juga bisa
menyediakan clues tentang bagaimana
bahasa-bahasa bisa berubah mulai sekarang.
“Model statistik kami bisa digunakan
untuk menjawab pertanyaan-pertanyaan ilmiah tentang bahasa dari waktu ke waktu,
tidak hanya untuk membuat simpulan-simpulan tentang masa silam, tetapi juga
untuk mengeksplorasi bagaimana bahasa bisa berubah di masa yang akan datang,”
kata Tom Griffiths, associate professor
psikologi, direktur Laboratorium Ilmu Kognitif Komputasional di UC Berkeley dan seorang co-author dari paper tersebut.
Penemuan tersebut telah membawa misi
UC Berkeley selangkah lebih maju
dalam hal pemahaman akan sebuah data besar dan dalam penggunaan teknologi baru
untuk mendokumentasi dan memelihara bahasa-bahasa yang terancam punah sebagai sumber-sumber
yang penting untuk pelestarian budaya dan ilmu pengetahuan. Sebagai contoh,
para peneliti berencana untuk menggunakan model komputasional yang sama untuk
merekonstruksi proto-bahasa-bahasa Amerika Utara.
Tulisan-tulisan kuno dari manusia tertanggal
kurang dari 6.000 tahun silam, lama setelah kemunculan banyak
proto-bahasa-bahasa. Sementara para arkeolog menangkap adanya tanda-tanda dari
bahasa-bahasa kuno dalam bentuk tertulis, para ahli bahasa secara khas
menggunakan apa yang dikenal sebagai “metode komparatif” untuk menjajaki masa
lalu. Metode ini membangun hubungan antara bahasa-bahasa, mengidentifikasi
bunyi-bunyi yang berubah secara tidak beraturan seiring berjalannya waktu untuk
menentukan apakah bahasa-bahasa tersebut mempunyai bahasa ibu yang sama.
“Untuk memahami bagaimana sebuah
bahasa berubah—yang bunyi-bunyinya lebih cenderung berubah dan akan menjadi apa
perubahan itu nantinya—memerlukan rekonstruksi dan analisis bentuk-bentuk kata
kuno dalam jumlah besar. Di sinilah rekonstruksi-rekonsruksi otomatis memainkan
peran pentingnya,” kata Alexandre Bouchard-Côté, seorang asisten profesor
statistik di University of British
Columbia dan pengarang kepala dalam studi gtersebut, yang dia mulai ketika
dia masih mahasiswa pasca sarjana di UC
Berkeley.
Model komputasional UC Berkeley ini didasarkan pada teori
linguistik yang sudah mapan bahwa kata-kata berevolusi di sepanjang
cabang-cabang sebuah pohon keluarga—menyerupai pohon genealogis—yang merefleksikan
adanya hubungan-hubungan linguistik yang berevolusi seiring waktu, dengan akar-akar
dan simpul-simpul yang merepresentasikan proto-bahasa-bahasa dan daun-daun yang
merepresentasikan bahasa-bahasa modern.
Dengan menggunakan sebuah algoritma
yang dikenal sebagai rantai Markov sampler Monte Carlo (Markov chain Monte Carlo sampler), program tersebut memilah-milah beberapa
rumpun bahasa (cognates), kata-kata
dalam bahasa-bahasa berbeda yang mempunyai bunyi yang sama, sejarah dan
asal-usul yang sama, untuk mengkalkulasi kemungkinan bahwa rumpun bahasa
tertentu atau kata-kata tertentu berasal dari proto-bahasa tertentu. Pada
masing-masing tahap, algoritma tersebut menyimpan sebuah rekonstruksi yang mengandung
hipotesis untuk masing-masing rumpun bahasa (cognate) dan untuk masing-masing bahasa leluhur.
“Karena bunyi berubah dan rekonstruksi-rekosntruksi
terkait erat dengan perubahan itu, maka sistem kita menggunakan perubahan-perubahan
itu untuk secara berulang-ulang saling memperbaiki satu sama lain,” kata Klein.
“Sistem tersebut pertama kali memperbaiki perubahan-perubahan bunyi
perkiraannya dan mengurangi rekonstruksi-rekonstruksi yang lebih baik dari
bentuk-bentuk kuno tersebut. Sistem tersebut kemudian memperbaiki
rekonstruksi-rekonstruksi tersebut dan menganalisis kembali perubahan-perubahan
bunyi tersebut. Langkah-langkah ini dilakukan berulang-ulang, dan kedua
prediksi tersebut secara perlahan akan menjadi lebih baik ketika struktur dasar-nya muncul
seiring waktu.
Share this
story on Facebook, Twitter, and Google:
http://www.sciencedaily.com/releases/2013/02/130212112025.htm
0 comments:
Post a Comment