Menghitung Term Frequency (tf)
Term frequency (tf) merupakan frekuensi kemunculan term (t) pada dokumen (d).
Contoh:
Terdapat kalimat:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Catatan: tiap kalimat dianggap sebagai dokumen.
Tentukan nilai tf!
Jawaban:
Jadi dokumen tiap kalimat ditandai:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Tabel tf:
Menghitung document frequency (df)
Document frequency (df) adalah banyaknya dokumen dimana suatu term (t) muncul.
Contoh: Dari soal yang sama pada menghitung tf, tentukan nilai df!
Jawaban:
Nilai df:
Atau:
Menghitung invers document frequency (idf)
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf!
Jawaban:
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (dengan jumlah dokumen=N)
Jawaban:
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (N=1000)
Jawaban:
Menghitung tf.idf
Hasil kali tf x idf
Contoh: Dari soal yang sama pada menghitung df, hitung nilai tf.idf! (dengan jumlah dokumen=N)
Jawaban:
Download this article: Pembobotan tf.idf
Oktober 23, 2010 pukul 6:44 pm
mas, saya msh bingung dgn contoh diatas N=jumlah dokumenkan?
tapi, log(N)=log(4)
mhn petunjuknya…trim’s
Oktober 23, 2010 pukul 6:47 pm
dicontoh nya itu D1,D2,D3,D4,D5. –>N=5 bukan mas??
November 3, 2010 pukul 7:26 pm
Iya, jumlah dokumen 5, seharusnya N=5. Saya lupa mengapa saya menggunakan Log(4/idf) ya… mungkin karena dulu saya menganggap D5 sebagai query. Thanks atas koreksinya.
Februari 4, 2012 pukul 7:14 am
ada contoh source code dalam phpx ga?
Juni 13, 2012 pukul 8:06 am
Contoh source code perhitungan frekuensi bisa dilihat tulisan saya disini:
https://temukembaliinformasi.wordpress.com/2009/07/17/contoh-program-source-code-tokenisasi-dan-menghitung-frekuensi-kata-dengan-php/