Meneruskan tradisi, seperti apa yang sebelumnya ditulis di sini, sana, dan situ. Waktu semester ketiga selesai kemarin entah kenapa mood untuk menulis enggan muncul, jadinya tak terdokumentasi deh ;p. Sekarang, empat semester terlewati sudah, sudah 2 tahun! Harusnya sih sudah lulus, tapi apa daya, thesis masih stuck di halaman introduction, hahahah.
Sedikit cerita tentang kampus di Bolzano… I love it more than the one in Nancy! Kenapa? Karena kalau misalnya saya keluar dari kamar berangkat jalan kaki menuju kampus, sambil mendengarkan mp3, pas satu lagu selesai saya sudah sampai di depan pintu kelas ^^. Sementara di Nancy, setengah jam naik bus menuju kampus, dan kadang terjadi tragedi terutama ketika ada demo. Jadi intinya… probabilitas saya bolos kuliah jauh lebih kecil di Bolzano ;).
Jumlah total mata kuliah yang saya ambil di semester III ada 4, antara lain:
1. Digital Library
2. XML Data Management
3. Computational Linguistics
4. Theory of Computing
Selain itu saya mengambil 2 buah project, yang satu hanya 2 credit, satu lagi 8 credit. Project 2 credit sudah saya selesaikan di semester III lalu, sementara project 8 credit baru saja minggu lalu laporannya selesai.
Mari kita bahas satu per satu mata kuliah dan dua project itu…
Digital Library
Sesuai dengan judulnya, kuliah ini membahas segala sesuatu yang berkaitan dengan digital library, mulai dari semua tentang digital content: text, image, audio, video, teknik-teknik indexing, protokol jaringan/network, dan tentu saja arsitektur sistem digital library. Di sesi praktikum di lab, kami bermain-main dengan Greenstone, software untuk membangun digital library.
Di akhir kuliah ada presentasi final project, dimana kelompok beranggota maksimal 3 orang mempresentasikan sistem digital library yang dibuat menggunakan Greenstone. Itu jadi salah satu komponen penilaian mata kuliah, di samping ujian. Ujiannya? Berkat kuliah ini saya jadi merasakan untuk pertama kalinya oral exam alias ujian lisan, yang ternyata… susah! >.<
XML Data Management
Selama kuliah ini saya jarang mendengarkan ketika sang dosen menjelaskan di kelas, tapi selalu semangat di sesi praktikum dan rasanya banyak belajar justru ketika di lab bukannya di kelas. Yang dipelajari di kuliah ini ya tentang XML dan segala yang berkaitan dengan XML: XML DOM, DTD, XML schema, XPath, XQuery, dan XSLT. Ujiannya… praktek bow! Koding XML, hihi…
Computational Linguistics
Kuliah dasar tentang computational linguistics atau natural language processing. Hampir semua yang dipelajari di kuliah ini sudah pernah dipelajari baik di Nancy maupun waktu kuliah S1 dan ketika menyusun tugas akhir. Praktikum di lab lagi-lagi berurusan dengan Python dan NLTK, sempat juga bermain-main dengan Weka.
Professor-nya baiiik banget. Masa ya, untuk persiapan ujian dia sudah menyiapkan sekitar 10 pertanyaan untuk setiap topik bahasan. Lalu, di kuliah terakhir, daftar pertanyaan itu dibahas jawabannya satu per satu, dan soal ujian diambil plek dari daftar pertanyaan itu. Mantaap! 😉
Selain ujian, nilai akhir digabung dengan nilai final project individual, yang dipresentasikan di akhir kuliah. Judul project saya: Dependency Parsing on Recipe Text, terinspirasi dari research project di Nancy.
The main idea of this project is how we can utilize dependency parsing bundled in Stanford parser to extract interesting properties from a recipe text, such as common verbs in recipes and their associated direct objects, or common noun in recipes that can be regarded as ‘the ingredients’ or ‘the tools used’.
Theory of Computing
Oke, saya akan curhat sedikit panjang lebar di sini. One thing for sure is… I’m super glad when this course was over and I could pass the exam XD. Isi kuliah ini: set theory *masih normal*, turing machine *awalnya normal, lama-lama kribo*, computability, decidability & undecidability, P, NP completeness, complexity, etc. *udah males nulisnya karena saya aja udah lupa dan ga ngerti apa yang saya tulis*. Intinya adalah, kuliah ini penuh dengan teorema beserta pembuktiannya yang bisa berlembar-lembar, penuh dengan simbol-simbol tak terpecahkan.
Cara mengajar sang professor yang dewanya ampun-ampunan itu, sungguh tradisional, dengan menulis di papan tulis. Masalahnya adalah, tulisannya menyamai tulisan dokter, untuk mencoba membaca dan menyalin kuliahnya ke catatan aja butuh konsentrasi tinggi, belum lagi memahami apa makna tulisan itu. Beugh. Materi kuliah di-upload sih, jadi ga mencatat pun tak masalah. Tapi… materi kuliah yang di-upload itu juga hasil tulisan dia, sama aja, hahah. Jadi memang harus datang dan mendengarkan dia menjelaskan supaya bisa mengerti tulisan *a.k.a kode morse* sang professor.
Ujiannya ada 2 part, di tengah semester dan akhir semester. Walaupun rasanya saya sudah belajar mati-matian, selama beberapa hari ngendon di perpus sampai tutup jam 12 malam, hasil ujian part 1 saya sungguh mengecewakan, walaupun lulus sih. Akhirnya bertekad mengulang ujian part 1, yang berarti di akhir semester saya mengikuti ujian full, part 1 dan part2, selama 4 jam berturut-turut.
Selama master study, rasanya baru di kuliah ini saya serius belajar mati-matian ga keruan. Hasilnya? Cukup memuaskan :). Puasnya sebagian besar karena saya merasa saya ga mungkin dapat lebih baik dari segitu, bwahahaha.. Cukup sudah penderitaan itu. Done.
2 Credits Project: DBPedia PageRank for Computing Semantic Relatedness
Many algorithms have been proposed to compute semantic relatedness between words. One of the method is to use a lexical semantic resources such as WordNet and Wiktionary. We propose to use another resource which is DBPedia to compute semantic relatedness between two concepts. We first build concept vectors associated with each concept, then use the PageRank score to measure the semantic relatedness by computing the cosine similarity between the two concept vectors.
Cukup menjelaskan kan ya judul dan abstraknya. Dari project ini saya belajar tentang pemrosesan teks dengan ukuran dataset yang super besar. Berkat project ini jadi kenal dengan yang namanya map reduce dan Apache Pig, juga Lucene indexing. Cuma, karena waktu itu prosesnya pake laptop sendiri yang prosesornya pas-pasan, akhirnya beberapa hari terpaksa jauh dari laptop dan merelakan sang laptop didominasi oleh script yang running berhari-hari T__T.
8 Credits Project: CCG Parsing on Large Corpora Using C&C Parser
Combinatory Categorial Grammar (CCG) is a lexicalized grammatical formalism, which provides a transparent relation between syntax and semantics, and designed to deal with long-range dependencies. This project mainly focus on CCG parsing, using a statistical parser called C&C parser. We first examine the performance of the parser and detect problems related with linguistic phenomena. Then we perform the parsing on very large corpora, Wikipedia and ukWaC. Finally we extract the statistics out of the parsing result, and analyse the result to obtain some interesting properties which can be useful for further research.
Project ini sebenarnya berfungsi sebagai preliminary tasks dari thesis saya, supervisornya pun sama dengan pembimbing thesis. Enak sih, sekali kerja 38 credits terlampaui sekaligus ;p. Ditambah lagi, laporan akhir dari project ini pun bisa dimasukkan sebagai introductory part dari thesis, hohoho.
Karena dataset yang dipakai juga super besar, kerjaannya jadi mirip seperti kerjaan di 2 credits project. The scripts are there, just run them. Bedanya, di project ini saya diberi akses ke computer clusters, jadi kerjaannya bisa dipecah-pecah dan dijalankan paralel. Setelah dihitung-hitung, total waktu yang dibutuhkan untuk parsing dataset kurang lebih 1900 jam, 80 hari! Untung bisa running paralel jadi saya cuma butuh waktu kurang lebih 2 minggu. Hasil parsing inilah yang nanti jadi dataset untuk thesis.
Tentang supervisor — salah satu dari mereka, karena saya punya 3 orang pembimbing project + thesis –, I don’t want to say this, but… she’s crazy! Kadang saya merasa sangat beruntung, karena rasanya seperti selalu dikejar-kejar, jadi cepat selesai. Tapi kadang… alamakjang.
Jadi kemarin itu, setelah menonton pertandingan Jerman vs Italia, saya terpaksa bergadang sampai jam 8 pagi karena saya sudah ditagih draft final laporan project *janjinya sih sebelum pertandingan sudah selesai, tapi gagal T__T*. Padahal deadline masih seminggu lagi, masih lama kan? ya kan? *dasar deadliner* ;p. Jam 8 pagi itu saya sudah tak sanggup, akhirnya draft dikirim, tapi bagian conclusion masih kosong.
Saya bangun jam 11, ternyata dia mengajak chat via skype jam 12. Terpaksa buru-buru cuci muka, lalu stand-by di depan laptop. And then she said, “Can you finish the conclusion part then send me the complete version.. at 1 PM? One hour is enough right?”. Shock. Baru bangun pula. Saya nego tambah satu jam, dan dia pun setuju. Akhirnya buru-buru baca keseluruhan laporan, terus memutar otak menulis kesimpulan.
Jam setengah 5 hari itu juga saya disuruh ke rumahnya untuk final correction, dan diskusi langkah selanjutnya yang harus dilakukan untuk thesis. Lalu entah kenapa, semua kerja keras itu rasanya terbayar lunas dengan komentar, “It’s a very good job. Well done!” 🙂
She’s crazy, but… she really knows how to deal with her students, especially a chronic procrastinator like me 😉
——-
Jadi, sekarang ini fokus saya benar-benar hanya tinggal satu: thesis.. menuju sidang Oktober! Yuk, mari…