エクセルを使用し、分析結果を簡単に確認できます!


 分析の中で、回帰、分散、主成分・要因、重回帰などのデータ分析・解析方法を説明しました。

   【1】「どのようにすれば」 信頼できる 「分析」 ができるのか?
   【2】「何」を「どれだけ」 集めれば良いのか?

  このように、「分析の出発点」 で困ったことがありませんでしたか?



    「分析」には焦点を定めるべき「視点」があったのです!
    「比較」により異常な状況を見分けることが出来ます。
     では、「何」と「比較」できるのでしょうか?

1.「偶然」と比較できれば、「異常」な現象が比較的簡単に分かる場合があります。

(1)データが「偶然」によって「ばらついている」のか否かを判定するために、「正規分布」との比較がポイントになります。
(2)収集したデータの「ばらつき」が「偶然」と異なるかどうか、データのグラフなどを正規分布と比較し、観察します。
(3)「偶然」でないデータの「ばらつき」に注目できれば、データ解析により異常原因の発見や改善に結びつくかも知れません。

  ◎ 実際のデータを「比較」し、「違い」に注目できれば、問題となる「異常」な状況を識別することが出来るかも知れません!

2.データの「違い」を簡単に識別するには、「ものさし」で「計測」することです。

(1)2種類のデータの「違い」は、「検定」という方法により「計測」します。
(2)「ものさし」は、正規分布、t分布、F分布などの確率密度関数のグラフです。
(3)ものさしの「目盛」は、確率分布より得られる「確率」です。
   次の図は、「ものさし」として、t検定で使用される「t分布」のグラフを示しています。
   図中の矢印が指している所が、「目盛」で、信頼性95%(有意水準 0.05 )の位置です。
   また、その位置の横軸の値が「t値」です。
   (※ 「検定」は、p値またはt値、いづれかの値を基になされます。)

t分布

 【図の説明】
    繰り返してサンプリングしたn個の分布は、標本平均と分散をパラメータとする確率密度関数となり、「t分布」と言われています。
   あるn個の標本をこのt分布と「比較」したとき、標本の多くは、中心の頂上付近に接近した所に分布します。
   t分布の両側の裾野で中心から遠く離れた所にn個全てが集中的に分布することは、起こりにくいことです。
   通常、このt分布の中心から遠く離れた「確率」の面積が 0.05 、となる位置に「目盛」を合わせ、「検定」が行われます。
   EXCELの「t検定」は、各標本の基になる母集団の平均の等しさを検定します。
   上図で標本が信頼性95%の信頼区間に入らない場合、「平均は等しい」という仮説が棄却されることになります。
    (※ 詳細は、EXCELヘルプ 「t検定」を参照願います。)

  ◎ 「ものさし」の使い方と、「目盛」の見方をマスターすることが分析を進めるポイントになります!

3.標本を効果的に探求し、分析するには、データ項目(要因)の「選択」と「組合せ」が重要です。

(1)データ項目(要因)の「組合せ」方法は、実験計画法などにより明らかです。
  要因と標本サイズを使用して計算式の「自由度」を求め、「直行表」を作成すると、最小限の「組合せ」となるからです。
  ※ 検定は、「違い」に注目します。 ですから、2つの標本があれば、「検定」ができます。
(2)データ項目(要因)の選択は、経験・知識・法則・原理などを基に行われます。
※ では、そもそも「何」を要因とすれば良いのか、ポイントをまとめました。
  1)要因は、モレ無く、ダブりなく、例外などさえ含めた対象の性質・属性に関連した内容の全てです。
  2)要因には、属性の「値」が一つひとつ決まります。 これが分析する標本となります。
  3)更に広く「分析」するために、関連する「値」をモレ無く、ダブりなく、例外などさえ含めて取り込み「分析」を検討します。
  4)役立つ要因の決定には、経験・知識・法則・原理などを基に、上記1)から3)を繰り返し検討し、総合的な判断が関連しています。
   ※ 解析する対象に関する「専門家」と相談し、関連する全ての要因を抽出できれば、分析がスタートできます。

  ◎ 最も有効で効率的な「要因の決定方法」は、研究成果として存在します。

4.データ数(標本の大きさ)は、 確率密度関数から逆算されて決まります。

検定は、t分布、F分布で行います。
t分布、F分布は、「標本サイズ」を一定にした条件で求められた確率分布です。
したがって、データ数(標本サイズ)は、t分布またはF分布の選択と「検定」条件を与えることにより「自動的」に計算されるのです。

  ◎ 確率分布の種類と検定の水準を決めると、標本サイズが決まります。



ところで、実際に「統計データ」は、どのように使用されているのでしょうか?
t分布、F分布による検定が意味があるのでしょうか?

鈴木敏文さんの「統計心理学」より引用しました。

 著: 勝見明 発行: 日本経済新聞社
 
【1】 日本ほど商品のライフサイクルが短い国は無い。
【2】 セブンイレブンでは扱う商品の7割が1年で入れ替わる。

 鈴木流顧客心理の掴み方
 「富士山型」発想を捨て「茶筒型」に転換せよ
  ――「昨日のお客」より「明日のお客」

ある日、急に売れ出し、ある日、急に売れなくなる、ということかも知れません。

【3】 発想の根本にある「五つの視点」
(1)鈴木流独自発想の視点
    変化の流れを時間軸で捉えると、今の時代の動きが分かる
(2)鈴木流独自発想の視点
    時間軸を輪切りにすると“本当のようなウソ”が見えてくる
(3)鈴木流独自発想の視点
    時間軸で未来から目を向けると、今の時代の顧客心理が読める
(4)鈴木流独自発想の視点
    脱経験的思考――過去の「常識」は今の「非常識」
(5)鈴木流独自発想の視点
    陰陽両面的思考――買い手の「合理」は売り手の「非合理」

このように、「偶然」の中に「人間心理」が入り込んだ「コンビニエンス・ストア」のようなPOSデータの場合、次の「視点」が必要になることが分かります。

◎ t分布、F分布ではなく、「時間」軸を基に時系列データの変化を良く観察し、法則を発見し、データから「時期」を割り出すことです。

したがって、データの種類により、「偶然」を基にした「確率論」から得られる分布を闇雲に適用することには問題があることが分かります。
「確率論」から得られる分布は、時間の変化を含まないデータに適用されることを知る必要があります。


「エリヤフ・ゴールドラット」さんの「ザ・クリスタルボール」より引用しました。

 訳: 三本木 亮 発行: ダイヤモンド社
 
273ページ「個々の店舗の需要予想を地域レベルで合計することで、その精度は各店それぞれの予想より三倍高くなる。統計学の基本だ。」

確かに、一つひとつの店舗に目を向けると、「統計解析」は、無力に見えます。
しかし、「需要予測」は、地域全体、さらに、日本全体に目を向けた場合、「偶然」の振る舞いをまとめた「統計量」として表すことが出来ます。

「需要予測」の信頼性が3倍、また、その3倍と高まるからです。
店舗が増えれば増えるほど「需要予測」の精度が高まり、商品を管理しやすくなるのです!

話をテーマに戻します。

エクセルは、「確率論」が適用できる統計データを処理できる便利なソフトウェアです。
広く使用されているMicrosoft Excelは、専用に開発された統計解析ソフトになっています!
Excelには、統計分析ツール、統計関数などの統計分析機能が数多く組み込まれているためです。
※ 本サイトは、このようなExcelを活用した統計データ解析の仕方を簡単に説明しました。

※ 詳細は、サイドメニューより「記事」のタイトルを選択し、参照願います。
※ 説明の主な内容は、エクセルのヘルプより引用した「ポイント」、となっています。

1.エクセル回帰分析
回帰分析とは
「回帰分析」とは、2つの変化するものを数値で関連付け、数式で表すことを言います。
式は、「回帰式」、直線として仮定した場合、この直線を「回帰直線」、と言います。

2.エクセル分散分析
分散分析とは
分散分析とは、収集したデータの「平均値の違い」の「ばらつき」に注目して比較(検定)する方法を言います。
また、「全てのデータの集合の母平均は、等しい」、という仮説が成立するかどうか検定します。

3.エクセル主成分・要因分析
主成分分析とは、要因分析とは
主成分分析(しゅせいぶんぶんせき、principal component analysis)とは、社会科学の経済学で作られた統計手法です。
その目的は、複数の変数間の相関関係を少数の変数で説明することです。
主成分は、相関行列の固有値問題の解として得ることができます。
(※相関関係を変えないで、見方を変化させると、見やすくなりことがあります。 固有値とは、軸を回転させて求めた軸方向の分散のことです。)

一方、要因分析の目的は、複数の要因から、結果に対して明らかに影響がある要因を求めることです。
主成分分析は、観測データから合成値(総合的指標)を計算できるようにすることが目的であるのに対し、
因子分析は、観測データが合成量であると仮定し、個々の主要な要因を見つけることが目的であり、基になる変数が異なります。

4.エクセル重回帰分析
重回帰分析とは
多くの要因の影響を数式化し、ひとつの回帰式を導くことが重回帰分析の目的です。
すでに説明しました「回帰分析」は、2変数の間の関係を数式で表すことでした。
これに対し、重回帰分析は、複数の要因(原因)である変数X1,X2,・・・と、原因の結果として変数Yとの関係を求めます。
式は、Y=a1*X1 + a2*X2 + a3*X3 + ・・・・ +b などとして表すことができます。
◎「要因分析」とは、この式のa1, a2, a3, ・・・・の中から絶対値の最大の係数を取り出し、その係数の変数を最も大きい影響を与える「要因」として抽出する方法です。

5.エクセルデータ分析入門
データ分析とは
エクセル データ分析とは、エクセルを使用し、目的を実現するためにデータを収集し、データの中から役に立つ情報を発見する過程です。
「目的」の中には、「売上げ増加」、「クレームの原因究明」、「異常原因の発見」、「業務の改善」などがあります。
役立つ情報を発見する過程は、「データマイニング」と言われることがあります。
データの中にある関連性に何らかの規則や法則性を発見するために、「採掘」作業が必要になるからです。

※ 詳細は、サイドメニューより「記事」のタイトルを選択し、参照願います。

エクセル データ解析をマスターしましょう!
分析 には、エクセル excel が大変便利です! Homeへ


×

この広告は180日以上新しい記事の投稿がないブログに表示されております。