Sistem Peringkas Berita Otomatis berbasis Text Mining menggunakan Generalized Vector Space Model: Studi Kasus Berita diambil dari Media Massa Online
Keywords:
focused crawler, generalized vector space model, peringkasan otomatisAbstract
Makalah ini akan membahas mengenai sistem yang memiliki fungsi utama membentuk ringkasan dari dokumen secara otomatis dengan menggunakan metode yang bersifat text mining. Sistem akan menggunakan berita sebagai dokumen sumber yang akan dibentuk ringkasannya. Sistem ini bersifat desktop based dan menggunakan internet sebagai sumber pencarian dokumen berita. Pencarian akan menggunakan focused crawler dan bersifat text mining yakni hanya diambil teks beritanya saja. Metode generalized vector space model (GVSM) adalah metode untuk menilai tingkat kemiripan tiap kalimat terhadap suatu topik dokumen. Dengan metode GVSM ini dapat diketahui kalimat mana yang lebih berbobot terhadap suatu dokumen sehingga dapat dilakukan peringkasan dengan memperhatikan tingkat kemiripan kalimat. Dari hasil perancangan dan pengujian didapat tingkat kesuksesan focused crawler sebesar 53% sementara dari kuesioner hasil ringkasan menggunakan metode GVSM dinilai secara rata-rata 2,71 dari skala 1-4 oleh empat puluh orang responden. Sistem mampu meringkas sebanyak 754 berita dari 797 berita yang didapat atau sekitar 94% dari berita yang didapat. Sehingga didapat kesimpulan bahwa sistem yang dirancang mampu mencari berita secara terarah sekaligus meringkas berita dengan hasil yang dapat diterima.