|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ ー : [ちょうおん] (n) long vowel mark (usually only used in katakana) ・ 化 : [か] (suf) action of making something ・ 差 : [さ] 1. (n,n-suf) difference 2. variation
スチューデント化残差(スチューデントかざんさ、)とは、統計学において、残差をその標準偏差の推定量で割って補正したものである。スチューデント化は「外れ値」の検出にあたり重要な技法である。 「スチューデント化」の名称はウィリアム・ゴセットの筆名「スチューデント」にちなむ。 ==誤差と残差== 誤差と残差の違いを理解することは非常に重要である。簡単な線形回帰モデル を考えよう。ここで「誤差」 ε''i'' , ''i'' = 1, ... , ''n'' は統計的に独立 ですべて同じ分散 σ2 をもつものとする。 残差は真でなく観測もできない誤差ではなく、観測可能なデータに基く誤差の推定値である。最小二乗法で α0 と α1を推定したとき、(誤差と異なり)残差は、独立ではありえない。なぜなら残差は以下の 2 つの拘束条件を満たすからである。 ここで は ''i'' 番目の誤差、 は ''i'' 番目の残差を表す。 さらに、誤差と異なり残差は、同じ分散を持たない。分散は対応する ''x''-値が ''x''-値の平均から遠ざかるにつれ減少する。これは回帰分析の予測値が、説明変数の分布する領域の端の方であるほどより影響を受けることと、データの回帰係数に及ぼす影響力が高いほど変わりやすいということによるものである。これは説明変数の分布の端の方のデータにおける残差はまた傾きの推定値によって大きく影響を受けるが、説明変数の分布の平均辺りのデータにおける残差は傾きによる影響をあまり受けないということによっても確認できる。''真の誤差の分散がすべて等しいにもかかわらず残差の分散が異なるという事実は、スチューデント化が必要な主要な理由である。''これは単に母集団パラメータ(平均と標準偏差)が未知であるという問題ではなく、一変量分布についての点推定のように同じ残差分布をデータが共有するのとは異なり、回帰分析するということが異なるデータポイントに対して異なる残差分布を生み出してしまうということである。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「スチューデント化残差」の詳細全文を読む スポンサード リンク
|