「生物統計学質問集(12月12日)」

  • #TodaiStat さらに続いて,多変量確率分布と多変量解析の話をした12月12日分. posted at 13:13:34
  • #TodaiStat 【質問】「多変量正規分布パラメトリック理論を勉強してみたいです.駒場線形代数では二次形式まではやりました」/【回答】多変量正規分布の指数部分は偏差ベクトルと分散共分散行列の二次形式なので,行列の固有値解析で分布の「形状」が決まります. posted at 13:20:36
  • #TodaiStat 【質問】「主成分分析の主軸が分散共分散行列の固有値に対応する理由が知りたい」/【回答】平均センタリングされた元変量X[i]の線形結合Σa[i]X[i] の分散共分散行列は a'Sa (Sは元変量の分散共分散行列)という二次形式になります.(続) posted at 13:26:45
  • #TodaiStat 【回答】(承前)a'a=1 というノルム制約のもとでこの二次形式を最大化すると(ラグランジュ乗数法),分散共分散行列の最大固有値に対応する固有ベクトルが線形結合の計数ベクトルとなり,最大固有値が分散最大値となります.これが第一主成分.下位主成分の計算も同じ. posted at 13:29:23
  • #TodaiStat 【質問】「主成分分析で全分散の何%が説明できれば妥当なのでしょうか?」/【回答】主成分分析はデータの変動の固有値分析によって線形代数的に部分空間を構築します.できるだけ少数の上位主成分軸で説明できればOK.ただし,軸がうまく “解釈” できるかは別問題. posted at 13:31:53
  • #TodaiStat 【質問】「クラスター分析の樹状図から何がわかるのか?」/【回答】多変量空間を「距離」のみに着目してグルーピングしたのがクラスター分析のデンドログラムです.しょせんは「分類」ですから高望みしない方がいいですね.(そこまで言う!) posted at 13:35:01
  • #TodaiStat 【質問】「クラスター分析のアルゴリズムを変えると結果がどのように変わるのか知りたい?」/【回答】Rコマンダーでやってみてください.アナタが見たいものを見ることができるでしょう.(そこまで言う!) posted at 13:36:46
  • #TodaiStat 【質問】「クラスター分析はノンパラメトリック統計なのか,それともパラメトリック統計学なのか?」/【質問】特定の確率分布を前提としないという意味でノンパラメトリックですね.クラスター分析は “クラスター” を心理的に認知するためだけのツール.(そこまで言う!) posted at 13:39:57