多重ロジスティック回帰とは、医学や疫学において病因究明の方法論として開発され、リスク要因の解析に用いられることが多い統計手法である。多重ロジスティック回帰分析には以下のような種類がある。
- 二項ロジスティック回帰分析:目的変数が何らかの現象の発生の有無を表した0/1の2値型データや、
現象が発生する確率の場合に用いる - 多項ロジスティック回帰分析:目的変数が3項(カテゴリー)以上の場合に用いる
- 順序ロジスティック回帰分析:目的変数が順序変数の場合に用いる
- 条件付きロジスティック回帰分析:ケースコントロール研究の分析に用いる
多重ロジスティック回帰 (Multiple Logistic Regression) では、従属変数とk個の独立変数との関係が以下の式で表される。
y は従属変数、P(y =1) は従属変数が正の応答、すなわち値が 1 となる予測確率、各biは回帰係数、xi は独立変数を表している。xi の値を変化させると、それに対応するy=1となる予測確率も、関連する回帰係数 biの符号と大きさに応じて、増加あるいは減少する。
多重ロジスティック回帰では、与えられた独立変数の観測値から従属変数の観測値を最も良く予測する回帰係数biの値の集合を求めることで、最も予測精度の優れた回帰式を導出する。
コメントする