自由度調整済決定係数の最大値を求める【国語と決断力】
読了時間: 約2分5秒
いよいよ検証
総当たり法で重回帰分析を実施、自由度調整済決定係数が最大となる組合せを検証。
前回より、5つの説明変数から2つ選び出して10通りの組み合わせをつくり、
それを大学入学共通テストの国語の得点を目的変数とした重回帰分析を行います。 10回の重回帰分析により、10個の自由度調整済決定係数が求まることになります。
自由度調整済決定係数の求め方
自由度調整済決定係数(Adjusted R Square)は以下の式で求められます。
自由度調整済決定係数を\( \ {}_{Adj}\mathrm{R}^2 \ \) とし、
観測数を\( \ n \ \) 、(特に \( \ n=31 \ \) )
説明変数の数を \( \ \mathrm{P} \ \) 、(特に \( \ \mathrm{P}=2 \ \) )
回帰平方和を \( \ \mathrm{SSr} \ \) 、
残差平方和を \( \ \mathrm{SSw} \ \) 、
全体平方和を \( \ \mathrm{SSt} \ \) 、
予測値を \( \ \mathrm{Y}_i \ \) 、
実測値を \( \ y_i \ \) 、
実測値の平均を \( \ \overline{y} \ \) とする。
\( \ {}_{Adj}\mathrm{R}^2=1-\displaystyle\frac{\mathrm{SSw}}{\mathrm{SSt}}\times \frac{n-1}{n-\mathrm{P}-1} \ \)
\( \ \ \quad \quad =1-\displaystyle\frac{\mathrm{SSw}}{\mathrm{SSr}+\mathrm{SSw}}\times \displaystyle\frac{n-1}{n-\mathrm{P}-1} \ \)
\( \ \ \quad \quad =1-\displaystyle\frac{\displaystyle\sum_{i=1}^{31}{\left( \mathrm{Y}_i-y_i\right)^2}}{\displaystyle\sum_{i=1}^{31}{\left( y_i-\overline{y}\right)^2}+\displaystyle\sum_{i=1}^{31}{\left( \mathrm{Y}_i-y_i\right)^2}}\times \displaystyle\frac{30}{28} \ \)
観測数を\( \ n \ \) 、(特に \( \ n=31 \ \) )
説明変数の数を \( \ \mathrm{P} \ \) 、(特に \( \ \mathrm{P}=2 \ \) )
回帰平方和を \( \ \mathrm{SSr} \ \) 、
残差平方和を \( \ \mathrm{SSw} \ \) 、
全体平方和を \( \ \mathrm{SSt} \ \) 、
予測値を \( \ \mathrm{Y}_i \ \) 、
実測値を \( \ y_i \ \) 、
実測値の平均を \( \ \overline{y} \ \) とする。
\( \ {}_{Adj}\mathrm{R}^2=1-\displaystyle\frac{\mathrm{SSw}}{\mathrm{SSt}}\times \frac{n-1}{n-\mathrm{P}-1} \ \)
\( \ \ \quad \quad =1-\displaystyle\frac{\mathrm{SSw}}{\mathrm{SSr}+\mathrm{SSw}}\times \displaystyle\frac{n-1}{n-\mathrm{P}-1} \ \)
\( \ \ \quad \quad =1-\displaystyle\frac{\displaystyle\sum_{i=1}^{31}{\left( \mathrm{Y}_i-y_i\right)^2}}{\displaystyle\sum_{i=1}^{31}{\left( y_i-\overline{y}\right)^2}+\displaystyle\sum_{i=1}^{31}{\left( \mathrm{Y}_i-y_i\right)^2}}\times \displaystyle\frac{30}{28} \ \)
こんな大変な計算を、組み合わせ10通りぶん行わないといけないの?とげんなりされる方もいらっしゃるかもしれませんが、 実際には、Googleスプレッドシートとアドオン「XLMiner Analysis ToolPak」を用いれば、誰でもあっさり求められます。
2023年7月12日、Kindleにて重回帰分析に関する本を書きましたので、
よかったらお読みください。
自由度調整済決定係数(Adjusted R Square)の値は、説明変数のあてはまりのよさを示しています。
10通りの自由度調整済決定係数のなかで、最大値をとる組み合わせを求めたと考えられます。
以下の記事一覧に他のボリュームのブログカードを載せています。
途中のボリュームからお読みになった方はこちらからどうぞ。