日々の事柄に関する雑記帳。


用語

CA
Correspondence Analysis
コレスポンデンス分析
対応分析
contingency table分割表
inertia
joint probability同時確率
marginal probability周辺確率
MCA
Multiple Correspondence Analysis
多重対応分析
principal coordinate主座標
standard coordinate標準座標
statistical independence統計的独立

コレスポンデンス分析

コレスポンデンス分析=対応分析

被験者の回答(質的データ)→クロス集計表による計量化、数量化→比率データ化→質的データの解析手法である。
クロス集計表のデータを多次元的に解析する手法=クロス集計データを用いた主成分分析型の手法
  • クロス集計表の行側、列側から比率データを集計し、分析を行う。→行側、列側の対応関係を分析する。
    • 行側、列側の独立性を検定する。→カイ二乗検定
  • 前提条件
    • 質問は、一つの選択肢への回答しか許さない。
    • 複数選択可の場合、クロス集計表は用いない。→直接、数量化理論3類(質的変数の主成分分析)を用いる。

カイ二乗検定と分析

カイ二乗検定
帰無仮説行、列間の関係は独立である(関係がない、無関係である)。
対立仮説行、列間には何らかの関係がありそうだ。

プロファイル=行、列側各項目の相対比率データ
プロファイルのカイ二乗距離=多次元データ
距離が近い比率データが似ている
距離が遠い比率データが似ていない
カイ二乗距離(加重付き距離)=加重平均指標
加重平均指標+次元削減の分析→主成分分析
主成分分析の固有値=行、列間の相関情報
カイ二乗分析行、列間の関連性を測る。
主成分分析行、列間の対応関係を測る。

例:相関係数の考え方

携帯電話の調査。
男女別に端末メーカーを集計した。
y1
Panasonic
y2
Sharp
row total
x1
男性
101929
x2
女性
13821
column total232750

\sum x_i y_i = 10 x_1 y_1 + 19x_1 y_2 + 13 x_2 y_1 + 8 x_2 y_2\\
\sum x_{i}^2 = 29 x_{1}^2 + 21 x_{2}^2\\
\sum y_{j}^2 = 23 y_{1}^2 + 27 x_{2}^2\\

(x_1, x_2)
\begin{pmatrix}
10 & 19 \\
13 & 8
\end{pmatrix}
\begin{pmatrix}
y_1\\
y_2
\end{pmatrix}=x^{t}Ay=R\\


(x_1, x_2)
\begin{pmatrix}
29 & 0 \\
0 & 21
\end{pmatrix}
\begin{pmatrix}
y_1\\
y_2
\end{pmatrix}=x^{t}By=1\\

(y_1, y_2)
\begin{pmatrix}
23 & 0 \\
0 & 27
\end{pmatrix}
\begin{pmatrix}
y_1\\
y_2
\end{pmatrix}=y^{t}Cy=1\\
タグ

管理人/副管理人のみ編集できます