Survey : Perolehan kembali informasi (Information Retrieval)
Juni 22, 2007 — amutiaraInformation Retrieval (IR) merupakan disiplin terkait dengan perolehan kembali (retrieval) data ‘tidak-tersturktur’, khususnya dokumen-dokuemn tekstual, sebagai tanggapan atas sebuah statement ‘query’ atau topik, yang bisa jadi tidak terstruktur juga, misal, sebuah kalimat atau bahkan dokument lain, atau bisa jadi terstruktur, misal, ekspresi boolean. Kebutuhan akan “metode efektif IR terotomatisasi” telah menjadi keharusan karena sudah sedemikian besar (the tremendous explosion in the amount) jumlah data tidak-terstruktur, baik koleksi data ‘corporate’ internal maupun dokumen yang diperoleh dari internet.
Report ini merupakan sebuah tutorial dan survey mengenai ‘state of the art’ , baik riset maupun komersial pada bidang yang dinamis ini.
Topik-topik yang dibahas antara lain:
- Formulasi statement query dan topik tidak-terstruktur dan terstruktur,
- Peng-indeks-an koleksi-koleksi dokumen,
- Metode komputasu similaritas query dan dokumen
- Klasifikasi dan routing dokumen ke pemakai berdasarkan statement topik atau kebutuhan.
- Clustering koleksi dokumen berdasarkan bahasa atau topik
- Metode statistik, probabilitas, dan semantik untuk menganalisis dan me-retrieve dokumen-dokumen.
Hasil survey bisa di DL di sini