日々の事柄に関する雑記帳。


用語

central limit theorem中心極限定理
cumulative distribution累積分布
discrete離散
distribution分布
dispersion分散
kurtosis尖度
probability distribution確率分布
skew歪度
standard normal probability distribution標準正規分布
standardization標準化
variance分散

確率分布

変数X、それが起こる確率Pとする。
確率分布XとPの対応関係

確率変数の平均値=期待値
E(X)
m
Xの期待値
Xの平均値
D(X)
σ
Xの標準偏差
V(X)
σ^2
Xの分散

Xが区間[α, β]を変域都市、f(x)の定義域を[a, b]とする。
  • f(x) >= 0, α =< x =< β
  • integral(a, b) f(x)dx = 1

Xが区間[a, b]に属する値を取る確率
P(a =< X =< b) = integral(a, b) f(x)dx
P(X)P値
f(x)Xの確率密度関数

度数分布

階級変量を区間で区切ったもの
級間階級の幅c
階級値階級の中間値
度数階級内のデータ数f

連続型確率変数

確率変数が0以上、1以下のように連続している。
サイコロの値の様に連続していないものは「離散型」と呼ぶ。

中心極限定理

母集団の平均と、標本集団の平均の誤差、その範囲内に収まる確率、を知る。
標本数が大きくなるほど、標本平均の分布は正規分布に近づく。
正規分布に近似するならば、偏差と標準偏差の比較から確率を求めることができる。

正規確率分布

N(m, σ^2)平均m、標準偏差σの正規確率分布
「Xは正規分布に従う」を表す。

標準正規分布

標準化

単位や平均値の異なるデータを比較するため、データを指数化する。
データの変換標準化
標準化された値標準化得点
Zスコア
Z = (X - m) / σ
ZはnN(0, 1)に従う。Zスコアは、平均0、分散1で標準正規分布する。

標準正規分布(Z分布)

μ(平均)0
σ(偏差)1

P値(確率)

0.3413
0.4772
0.4987
±1σ0.6826
±2σ0.9544
±3σ0.9974
±1σ - ±2σ0.2718
±1σ - ±2σ - ±3σ0.0430

モーメント(積率)

分布の特徴を表す。
1次のモーメント平均分布の値
2次のモーメント分散分布の広がり、散らばり
3次のモーメント対称性、歪度正規分布と比較した、分布の偏り
4次のモーメント尖度正規分布と比較した、平均の集中

歪度

正の値グラフは左に偏り、右裾が長くなる。
負の値グラフは右に偏り、左裾が長くなる。

尖度

正の値グラフは尖る。
負の値グラフが平坦になる。

正規確率プロット

データの分布が正規分布に従っているかを調べる。
プロットが一直線上に並ぶと、正規分布に従っていると考えられる。
正規P-Pプロット縦軸に累積確率の期待値、横軸に観測値順位に基づく累積確率を並べる。
正規Q-Qプロット縦軸に観測値の期待値、横軸に観測値を並べる。
タグ

管理人/副管理人のみ編集できます