多変量解析とは何かを調べてみた【競馬予想で多変量解析を学ぶ】

そもそも、多変量解析って何よ?

Lukia
ということで、
『多変量解析による統計的馬券戦略(重回帰分析,判別分析,AID分析の入門書)』小口定男著
を買ったものの、この本には、「多変量解析とは何か?」という説明はありません。
というわけで、いくつかのサイトを巡って私なりに「多変量解析」についてまとめ、スライド化してみました。
主にお世話になったのは、以下の2つのページです。
多変量解析とは
多変量解析とは、複数の変数に関するデータをもとに、
これらの変数間の相互関連を分析する統計的技法の総称のことです。
あれやこれや分析手法があるのですが、いちいち個別で呼ぶのはめんどくさいので、
ひっくるめて「多変量解析」と呼ぶということですね。
ですから、多変量解析という特定の分析方法は存在しないということになります。
そして、上記の青文字部分をもう少しかみくだくと、
多変量解析は、
「様々な分析方法を用いて、多数のデータから結果を予測したり、シンプルな計算式のような指標を導いたりする手法のこと」
と定義することもできるようです。
目的いろいろ♪データも色々♪
島倉千代子さんの『人生いろいろ』にかけたタイトルにしてみましたが、わからない世代が多いんでしょうねぇ。。。
なぜ「多変量解析」というざっくりした名前がついたか。という理由にもなるかと思われるのですが、
多変量解析で分析できることは、上図のようにいろいろあります。
逆にいうと、「扱うデータ」と「目的(何を知りたいか)」によって、とるべき分析手法が変わってくるので、
単独万能な解析方法があるわけではないんですね。
ここまで調べてようやく、

Lukia
と理解できました。
多変量解析で扱う4種類のデータ
そして、一口に「データ」といっても、実際には4種類に分類できることも知りました。
まず、ざっくりと量的データ(定量的データとも)と質的データ(定性的データとも)の2つに分類され、
さらにそこから、間隔尺度・比例尺度・名義尺度・順序尺度の4つに分類されます。
以下の図は、『図解入門ビジネス多変量解析の基本と実践がよ~くわかる本』森田浩著を参考にして、
上図と同じ内容をまとめたものです。
多変量解析を用いる目的
なぜ多変量解析を行うのか。
その目的は大きく2つに分かれます。
ひとつは、「予測」のため。
もうひとつは、「要約」のため。です。
さらに、この目的をもう少し細かく分け、それに見合った分析方法を表にまとめたものが
先に挙げた森田本にありましたので、その「多変量解析手法の分類」表を引用してみます。
これから私が学ぶのは「予測」に関する多変量解析
多変量解析を行うのは、「予測」と「要約」という目的を満たすためであることがわかりました。
すると、だんだん頭の中でつながってきます。
本のタイトルに「馬券戦略」とあるように、勝ち馬を予測することが目的であること、
そして、森田本の「多変量解析手法の分類」表で「重回帰分析」と「判別分析」が「予測」目的に含まれていることから、

Lukia
と気がつきました。

Lukia
時間はかかってしまいましたが、そのぶん、「予測する方法を学ぶんだ!」という
そもそもの目的を明確にできたので、よかったのではないかと思います。
そして目的は明確になったものの、四苦八苦な学習が始まるのでした。
以下の記事一覧に他のボリュームのブログカードを載せています。
途中のボリュームからお読みになった方はこちらからどうぞ。