重回帰

エクセル 重回帰分析を簡単に解決しました。


エクセル 分析をマスターしましょう!
分析 には、エクセル excel が大変便利です! Homeへ
重回帰

エクセル重回帰分析


1.エクセル 重回帰分析とは

多くの要因の影響を数式化し、ひとつの回帰式を導くことが重回帰分析の目的です。
「回帰」記事で説明しました「回帰分析」は、2変数の間の関係を数式で表すことでした。
これに対し、重回帰分析は、複数の要因(原因)である変数X1,X2,・・・と、原因の結果として変数Yとの関係を求めます。
式は、Y=a1*X1 + a2*X2 + a3*X3 + ・・・・ +b などとして表すことができます。
◎「要因分析」とは、この式のa1, a2, a3, ・・・・の中から絶対値の最大の係数を取り出し、その係数の変数を最も大きい影響を与える「要因」として抽出する方法です。

2.エクセル 重回帰分析の例題

重回帰分析の例題をEXCELヘルプから引用し、説明しました。

既知の x1 20 28 31 38 40
既知の x2 18 20 30 32 38
既知の y  06 07 09 15 21

主な解析手順は、次の通りです。
(1) 行列を入替えて行うため、上記のテーブルを次のようにします。

既知のx1   既知のx2   既知のy
20        18        6
28        20        7
31        30        9
38        32        15
40        38        21

(2)「分析ツール」を起動します。
エクセル2003までは、「ツール」−「分析ツール」を選択します。
エクセル2007の場合、「データ」−「分析ツール」を選択します。
なお、「分析ツール」がメニューに表示されていない場合、「オプション」−「アドイン」−「分析ツール」を選び、ツールを使用できます。
(3)「分析ツール」ダイアログボックスが開きます。
(4)リストの後半から「回帰分析」を選択し、OKボタンを押し、「回帰分析」ダイアログボックスを開きます。
(5)「入力元」−「入力y範囲」にラベルから選択し始め、列方向にマウスでドラッグして範囲を選択します。
(6)「入力元」−「入力x範囲」にラベルから選択し始め、列方向にマウスで2列をドラッグし、範囲を選択します。
(7)ラベルを解析結果に表示させるため、「ラベル」にチェックを入れます。
(8) 必要がある場合「有意水準」にチェックを入れ95% の値を 99%または90%などと修正します。
 ※ 有意水準とは、予め与える仮設である「帰無仮設」を偽として棄却してしまう誤りを犯す確率です。
   回帰分析の場合、分析結果に表示される「P−値」が(100-有意水準)/100より小さくなったとき結果を再チェックすることが必要です。
(9)「出力オプション」、「残差」、「正規確率」−「正規確率グラフの作成」などに必要に応じてチェックを入れ、OKボタンを押します。
 ※ 「正規確率グラフ」は、「残差」の百分位数のグラフを作成する場合にチェックします。
   残差つまりエラーが正規分布になっている場合、グラフが直線となっているかどうか、簡単にチェックできます。
(10)「p値」が「(100-有意水準)/100」と比較し、小さい場合、「帰無仮設」を棄却します。

3.エクセル 回帰分析の検証

(1)「偶然」との比較は、どこでなされているのでしょうか?
   「回帰分析」に記事で既に説明した内容と同様に、次の通りです。
  y = a1x1 + a2x2 + b 式のa1, a2, b は、「回帰直線」から(x , y )点までのy方向の距離(△y、残差)の二乗の総和が最小になるように計算されます。
  この計算は、t 分布の「標本平均」の計算と同じであり、標本サイズを考慮した確率に基づく計算であることが分かります。
  この計算方法は、標本平均を数多く収集すると、「偶然」を示した分布になる、としているのです。
  「偶然」とみなすことが出来る標本サイズは、グラフによる判断や経験より、30個以上です。
  また、(x , y )点の総数(標本サイズ)が大きくなると、「偶然」を表した「正規分布」に近づきます。
(2)「ものさし」として使用されている確率分布は、どの分布でしょうか?
  t分布です。
(3)「目盛」は、どこにあり、「精度」は、どれ程でしょうか?
  「p値」は、確率の「目盛」で、t分布の両側に広がる稀に起こる確率を示しています。
  この値は、小さいほど、検定統計量がその値となることがあまり起こりえないことを意味しています。
  また、「精度」と考えられる基準は、「有意水準」で、この基準以下の確率になった場合、検定の信頼性をチェックする必要があります。
  また、「精度」と考えられる基準は、「有意水準」で、この基準以下の確率になった場合、仮説を棄却する必要があります。
  (※ 「帰無仮説」、「H0」などの、「差がない」、という仮説を立て、その仮説を棄却します。)
  Homeページで述べましたように、「t値」は、回帰分析で得られた相関係数 a1 a2 a3 ・・・ b のt分布での横軸の「目盛」です。
  p値の 0.05 と対応した t値 として計算されます。

  例題のt値、p値は、「回帰分析」により計算され、結果に表示されます。
  次に計算結果の一部を示しました。

       係数     標準誤差      t      P-値      下限 95%   上限 95%
切片    -9.350235849  6.829942153 -1.369006595 0.304470274  -38.7371051  20.0366334 
既知の x1 0.284871968  0.571849265  0.498159192 0.667758185  -2.175596834 2.745340769
既知の x2 0.434973046  0.54708202  0.795078307  0.509933939  -1.918930899 2.788876991

この結果より 回帰式は、 y = 0.284871968x1 + 0.434973046x2 −9.350235849 となることが分かります。

1) 下限 95%は、その要因の95%信頼区間の「下限」です。
2) 上限 95%は、その要因の95%信頼区間の「上限」です。
  したがって、上限と下限のそれぞれの切片と係数(既知のx)を使用し、作成された2つの直線の間の領域が95%信頼区間です。
3) 「p値」が、有意水準の0.05または、0.01と比較し、より小さかった場合、回帰式を再チェックする必要があります。
   「p値」の値が水準以下となり、仮説を棄却することになるからです。




エクセル 分析をマスターしましょう!
分析 には、エクセル excel が大変便利です! Homeへ
【重回帰の最新記事】
posted by Yy at 13:38 | Comment(0) | TrackBack(0) | 重回帰 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。