翻訳と辞書 |
Tf-idf
tf-idfは、文書中の単語に関する重みの一種であり、主に情報検索や文章要約などの分野で利用される。 tf-idfは、tf(、単語の出現頻度)とidf(、逆文書頻度)の二つの指標にもとづいて計算される。
は単語の文書における出現回数、は文書におけるすべての単語の出現回数の和、は総文書数、は単語を含む文書数である。そのため、idfは一種の一般語フィルタとして働き、多くの文書に出現する語(一般的な語)は重要度が下がり、特定の文書にしか出現しない単語の重要度を上げる役割を果たす。 == 関連項目 ==
* 潜在意味解析
抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Tf-idf」の詳細全文を読む
スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース |
Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.
|
|