|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ 数 : [すう, かず] 1. (n,n-suf) number 2. figure ・ 数値 : [すうち] 【名詞】 1. numerical value ・ 値 : [あたい, ね] 【名詞・形容詞】1.value, variable 2. price, cost 3. worth, merit ・ 例 : [れい] 【名詞】 1. instance 2. example 3. case 4. precedent 5. experience 6. custom 7. usage 8. parallel 9. illustration
アンスコムの例(Anscombe's quartet)あるいはアンスコムの数値例とは、回帰分析において、散布図はそれぞれ異なるのに回帰直線やその他の統計量が同じになってしまう現象について、統計学者のが1973年に紹介した例である。回帰分析をする前に散布図を確認し傾向を把握することの重要性、そして外れ値が統計量に与える影響の大きさを示している。 == 概要 == アンスコムの例は右のグラフに示された4つのデータセットからなる。4つ全てについて以下が成り立つ。 第一の散布図(左上)は、両変数が相関し正規性の仮定にも従う単純な線形関係があるように見える。一方二番目のグラフ(右上)では、二変数の間に確かにある関係があるのが認められるが、それは線形関係ではない。従ってピアソンの積率相関係数を用いるのは不適当である(より一般的な回帰、そしてそれに関しての決定係数を用いるのがより適当だろう)。3番目のグラフ(左下)では、分布は線形であるが、回帰直線はその分布と異なっている。その差異は外れ値によって埋められるものだ。この外れ値の影響で回帰直線は変わり、相関係数は1から0.816に下がってしまっている(この場合はが必要となる)。最後の4番目の例は、本来線形関係にない二変数でも、外れ値が一つあれば高い相関係数が算出されてしまうことを示した例である。 この例は現在でも、データセットをある特定の関係に当てはめて分析する前に図を用いて可視化するのが重要であること、そしてデータセットの実際を表現するには基本統計量だけでは不十分であることを示す例としてしばしば使われている。 実際のデータセットは以下の通りである。なお、''x'' の値は最初の3つのデータセットでは全て等しくなっている〔。 近年では、この例のような同一の統計量と異なる見た目をもつデータセットを作出する方法が開発されている。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「アンスコムの例」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Anscombe's quartet 」があります。 スポンサード リンク
|