日々の事柄に関する雑記帳。


分類問題カテゴリを予測する。
回帰問題数値を予測する。
教師あり学習データ+教師(正解ラベル)
教師なし学習データをもとに機械が自分で学習する。
強化学習エージェント+環境

教師あり学習

トレーニング・データ学習に利用する。
テスト・データ学習したモデルのテストに利用する。
機械学習モデルを構築し、未知のデータを予測する。
統計学データを解析し、減少を説明する。
過学習バリアンスが高い。
学習不足バイアスが高い。

強化学習

  1. 環境に対するエージェントの行動を評価する。
  2. 評価に応じてエージェントに報酬を与える。
  3. 報酬に基づいて次の行動を決定する。
タグ

管理人/副管理人のみ編集できます