日々の事柄に関する雑記帳。


用語

binomial variance二項分布
correlation相関
correlation coefficient相関係数
covariance共分散
deviation偏差
distribution分布
inference推論、推定
interquartile range四分位範囲
interval data間隔尺度
multinomial variance他項分布
nominal data名義尺度
ordinal data順序尺度
population母集団
probability theory確率論
sample標本
standard error標準誤差
standard error of mean
standard error of sample mean
標本平均の標準誤差
variance分散

データの種類

分類1分類2特徴分布の中心グラフ分布のばらつき
Qualitative data
質的データ
名義データ
nominal data
区別することに意味があるID、性別mode
最頻値
棒グラフ
円グラフ
二項分布~多項分布
順序データ
ordinal data
順序に意味があるよい/どちらでもない/わるいmedian
中央値
棒グラフ
ヒストグラム
四分位範囲
Quantitative data
量的データ
比尺度
ratio
比率に意味がある
0が起点となる
経過時間、速度、身長mean
平均
ヒストグラム標準偏差
間隔尺度
interval data
値の間隔に意味がある気温、体温
温度は間隔尺度である。温度にとって10度、15度の間隔(5度)に意味はあるが、その比率(50%)に意味はない。

標準偏差

偏差deviation平均からの乖離を示す。
ある値と、全体の平均との差
分散variance偏差の2乗
平均偏差mean deviation偏差の絶対値の和
標準偏差standard deviation全ての分散の合計から、その平均を求める。平均の平方根が標準偏差
言い換えると、偏差とは平均からどれほど離れているのか。その距離、幅。

データの標準化

平均を0、標準偏差を1にする。
異なるデータ間での比較が可能となる。

共分散

2つの対応するデータ間の、偏差の積の平均。
2つの変数の関係を示す。
偏差の積なので、単純に価の大小だけで関係の強度を決めることはできない。

相関係数
共分散同士を直接比較することはできないため、相関係数を用いて比較する。
2変数の共分散を、それぞれの偏差の積で割ることで求める。
相関係数は-1から1の間の値を取る。両端に値に近いほど、強い関係性を示す。
相関係数強さ
-1〜-0.7強い負の相関
-0.7〜-0.4かなりの負の相関
-0.4〜-0.2やや負の相関
-0.2〜0.2ほとんど相関無し
0.2〜0.4やや正の相関
0.4〜0.7かなりの正の相関
0.7〜1強い正の相関

母集団と標本

母集団から複数の標本を取得したとする。
  • 標本平均の分散、母集団の分散/標本のサイズ
  • 標本のサイズが大きくなるほど母集団に近づく。
標準誤差
全標本の標準偏差を、標準誤差と呼ぶ。
標本から得られる推定量のばらつきを表す。
標準誤差は、一般的に標本平均の誤差を指す。
タグ

管理人/副管理人のみ編集できます