|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 異 : [い] (pref) different ・ 異常 : [いじょう] 1. (adj-na,n) strangeness 2. abnormality 3. disorder ・ 常 : [とわ, じょう] 1. (adj-na,n) eternity 2. perpetuity 3. immortality ・ 検知 : [けんち] (n,vs) detection
データマイニングにおいて、異常検知(いじょうけんち、;または外れ値検知、)は、期待されるパターンまたはデータセット中の他のアイテムと一致しないアイテム、イベント、または観測を識別することである〔〕。通常、異常なアイテムは、構造欠陥、医学的な問題、文書中の誤り検出などのある種類の問題に翻訳する。異常(anomaly)は、外れ値(outlier)、珍しい物(novelty)、雑音(noise)、変動(deviation)、例外(exception)、などとも呼ばれる〔〕。 特に悪用やネットワーク侵入検知の状況では、興味深いオブジェクトは多くの場合''レアな''オブジェクトではなく、活動中の予期されない''バースト''である。このパターンはレアオブジェクトとして外れ値の一般的な統計的定義に従わず、適切に集計されない限り、多くの外れ値検知法(特に教師なし手法)はそのようなデータで失敗する。代わりに、クラスタ分析アルゴリズムはそのようなパターンで形成されたマイクロクラスタを見つけることが可能である。 異常検知技術には大きく分けて3通りの分類がある。教師なし異常検知(Unsupervised Anomaly Detection)手法は、データセット内のインスタンスの大多数は正常であるという仮定の下でデータセットの残りにほとんどフィットしないと思われるインスタンスを探すことによって、ラベル付されていないテストデータセットにある異常を見つける。教師あり異常検知(Supervised Anomaly Detection)手法は「正常」と「異常」にラベル付されたデータセットを必要とし、分類器を訓練することを含む(他の多くの統計分類問題との決定的な違いは固有の外れ値検出の不均衡な性質である)。半教師あり異常検知(Semi-supervised Anomaly Detection)手法は与えられた''正常な''訓練データセットから正常な振る舞いを表すモデルを構成し、そして学習したモデルによって生成されるテストインスタンスの尤度をテストする。 ==適用例== 異常検知は、侵入検知システム、詐欺検知、誤り検知、システムヘルスモニタリング、センサネットワークのイベント検知、生態系の乱れの検知など、様々な分野に応用できる。データセットから異常なデータを除去するための前処理でしばしば使われる。教師あり学習では、データセットから異常なデータを除去することはしばしば精度の統計的に有意な増加をもたらす。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「異常検知」の詳細全文を読む スポンサード リンク
|