Pembobotan tf.idf

Menghitung Term Frequency (tf)
Term frequency (tf) merupakan frekuensi kemunculan term (t) pada dokumen (d).
Contoh:
Terdapat kalimat:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Catatan: tiap kalimat dianggap sebagai dokumen.
Tentukan nilai tf!

Jawaban:
Jadi dokumen tiap kalimat ditandai:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Tabel tf:

10_1
Menghitung document  frequency (df)
Document  frequency (df) adalah banyaknya dokumen dimana suatu term (t) muncul.
Contoh: Dari soal yang sama pada menghitung tf, tentukan nilai df!

Jawaban:
Nilai df:

10_2

Atau:

10_3

Menghitung invers document frequency (idf)

10_4

Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf!
Jawaban:
10_5

Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (dengan jumlah dokumen=N)
Jawaban:

Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (N=1000)
Jawaban:

10_6

Menghitung tf.idf
Hasil kali tf x idf
Contoh: Dari soal yang sama pada menghitung df, hitung nilai tf.idf! (dengan jumlah dokumen=N)
Jawaban:

10_7

10_8

Download this article: Pembobotan tf.idf

5 Tanggapan to “Pembobotan tf.idf”

  1. kadung Says:

    mas, saya msh bingung dgn contoh diatas N=jumlah dokumenkan?
    tapi, log(N)=log(4)

    mhn petunjuknya…trim’s

  2. kadung Says:

    dicontoh nya itu D1,D2,D3,D4,D5. –>N=5 bukan mas??

    • sifa Says:

      Iya, jumlah dokumen 5, seharusnya N=5. Saya lupa mengapa saya menggunakan Log(4/idf) ya… mungkin karena dulu saya menganggap D5 sebagai query. Thanks atas koreksinya.

  3. aisah Says:

    ada contoh source code dalam phpx ga?


Tinggalkan komentar