|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 文 : [ぶん] 【名詞】 1. sentence ・ 文書 : [ぶんしょ, もんじょ] 【名詞】 1. document 2. writing 3. letter 4. paperwork 5. note 6. records 7. archives ・ 書 : [しょ] 【名詞】 1. penmanship 2. handwriting 3. calligraphy (esp. Chinese) ・ 分 : [ぶん, ふん] 1. (n,n-suf,pref) (1) part 2. segment 3. share 4. ration 5. (2) rate 6. (3) degree 7. one's lot 8. one's status 9. relation 10. duty 1 1. kind 12. lot 13. (4) in proportion to 14. just as much as 1 ・ 分類 : [ぶんるい] 1. (n,vs) classification 2. category
文書分類(ぶんしょぶんるい、)は、情報科学における問題である。電子文書をその内容に基づいて、1つ以上に分類する。文書分類には、外部から(例えば人間が)正しい分類に関する情報を与える教師あり文書分類と、外部の情報を参照せずに分類する教師なし文書分類がある。 == 技法 == 文書分類に使われる技法としては、以下のものがある。 * 単純ベイズ分類器 * tf-idf * 潜在意味解析 * サポートベクターマシン * ニューラルネットワーク * k近傍法 * 決定木(例えばID3) * コンセプトマイニング 他にも、自然言語処理に基づく手法がある。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「文書分類」の詳細全文を読む スポンサード リンク
|