|
二項分類(にこうぶんるい、)は、オブジェクトの集合を個々のオブジェクトがある特定の属性を持つかどうかで2種類にグループ分けする分類作業である。二値分類(にちぶんるい)、2クラス分類とも呼ばれ、多クラス分類において分類先のクラス数が2の場合と考えることができる。二項分類が一般に使われる分野としては、以下のものが挙げられる。 * 臨床検査で患者が特定の疾病に罹患しているか否かで分類する(分類属性は疾病)。 * 工場での品質管理。すなわち、ある製品が出荷できる品質か、それとも捨てるべきかの判断(分類属性は品質)。 * あるページや記事を検索結果に含めるか否か。(分類属性はその記事の関連性、例えばある単語が含まれているかどうか) 分類は統計学の学問分野であり、計算機科学でも研究されており、特にデータを自動的に分類する学習システムの研究がある(機械学習)。典型的な二項分類器としては、決定木、ベイジアンネットワーク、サポートベクターマシン、ニューラルネットワークなどがある。 分類は時には自明な取るに足らない作業となることもある。青いボールと赤いボールが合計で100個あったとき、これを分類するのは色覚が正常な人間なら、非常に簡単である。しかし、臨床検査の場合などは分類は簡単ではなく、間違う場合もある。計算機科学での興味もそのような難しい分類の自動化にある。 == 仮説検定 == 従来からの仮説検定では、検定者は帰無仮説と対立仮説を立てることから始め、実験を行い、帰無仮説を棄却して対立仮説を採用できるかどうかを判断する。 結果が有意であれば、帰無仮説は棄却される。帰無仮説が実際には真であるのにこれを行うことを「偽陽性; false positive」または第一種過誤と呼ぶ。逆に帰無仮説が偽である場合は、「真陽性; true positive」と呼ぶ。 有意でない結果の場合、帰無仮説を棄却できない。帰無仮説が実際には偽であるのに棄却しない場合を「偽陰性; false negative」または第二種過誤と呼ぶ。逆に帰無仮説が真である場合は、「真陰性; true negative」と呼ぶ。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「二項分類」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Binary classification 」があります。 スポンサード リンク
|