Stopword

stopwordProses stopword adalah menghapus kata sambung yang terdapat pada kalimat dengan alasan hampir 80% kata dalam suatu dokumen tidak bisa digunakan dalam IR dan mengurangi jumlah indeks 40%. Contoh kata-kata yang termasuk dalam stopword adalah :

  1. Kata penghubung (sesudah,selesai,sebelum)
  2. Kata tugas (bagi, dari, dengan, pada)
  3. Kata keterangan (sangat, hanya, lebih)
  4. Kata bilangan ( beberapa, banyak, sedikit)
  5. Kata ganti ( kami, mereka, kita, itu) dan lain-lain

Kata-kata yang termasuk dalam stopword ini kemudian diletakkan dalam database dan dikumpulkan menjadi satu sehingga sistem yang akan dibangun mengenali terlebih dahulu kata-kata yang termasuk dalam stopword dan tidak menghitungnya pada pembobotan kata

2 comments on “Stopword

  1. apakah sama tahapan text processing,pembobotan index,pembobotan kata pada sistem temu kembali informasi…sama dengan 5 tahapan yang ada pada text mining… tolong penjelasannya…

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s