日々の事柄に関する雑記帳。



リサンプリング統計手法

  • 母集団からサンプリングされた標本を仮の母集団とする。
  • 仮の母集団からデータをサンプリングし、標本とする。
  • 問題点
    • 標本は、母集団にはないバイアスを持つ可能性がある。→結果に影響する。
    • バイアスを小さくするには、標本データ数を多くしなければならない。
ブーツストラップ無作為同数サンプリング(重複有)
ジャックナイフ無作為同数サンプリング(重複無)
モンテカルロパラメータ推定値に基づくデータ生成

ブーツストラップ(ノンパラメトリック・ブーツストラップ)

母集団のデータを無作為に選択し、標本とする。
単一標本中に、複数の同一データが含まれることがある。→重複
オリジナル・ツリー元データから計算された近隣結合樹
コンセンサス・ツリーリサンプリング・データの系統樹を集計したもの→元データとは無関係

ジャックナイフ

母集団のデータを無作為に消去し、標本とする。
単一標本中に、複数の同一データが含まれない。
消去するデータ数が少ない。→標本ごとのばらつきが少ない。

モンテカルロ(パラメトリック・ブーツストラップ)

母集団が従う統計モデルを仮定する。
リサンプリング・データの統計量=パラメータ推定値
統計モデルとパラメータ推定値に基づいて、疑似データを生成する。

系統推定法

速度間違い
距離法高速単一解情報損失距離尺度が重要
再節約法速い複数解Felsenstein zone
最尤法最も遅いFarris zone
ベイズ法遅い
最尤法より高速
事前確率収束判断に苦しむ
タグ

管理人/副管理人のみ編集できます