多変量解析とは何かを調べてみた【競馬予想で多変量解析を学ぶ】

2023年3月1日多変量解析

『多変量解析とは何かを調べてみた』のアイキャッチ画像
読了時間: 約429

そもそも、多変量解析って何よ?

Lukia_74

Lukia

データ分析の手法を使えば競馬予想もできるらしい!

ということで、
『多変量解析による統計的馬券戦略(重回帰分析,判別分析,AID分析の入門書)』小口定男著

を買ったものの、この本には、「多変量解析とは何か?」という説明はありません。

というわけで、いくつかのサイトを巡って私なりに「多変量解析」についてまとめ、スライド化してみました。

主にお世話になったのは、以下の2つのページです。


多変量解析とは

多変量解析とは、複数の変数に関するデータをもとに、
これらの変数間の相互関連を分析する統計的技法の総称のことです。

あれやこれや分析手法があるのですが、いちいち個別で呼ぶのはめんどくさいので、
ひっくるめて「多変量解析」と呼ぶということですね。
ですから、多変量解析という特定の分析方法は存在しないということになります。

そして、上記の青文字部分をもう少しかみくだくと、
多変量解析は、
「様々な分析方法を用いて、多数のデータから結果を予測したり、シンプルな計算式のような指標を導いたりする手法のこと」
と定義することもできるようです。

目的いろいろ♪データも色々♪

島倉千代子さんの『人生いろいろ』にかけたタイトルにしてみましたが、わからない世代が多いんでしょうねぇ。。。


なぜ「多変量解析」というざっくりした名前がついたか。という理由にもなるかと思われるのですが、
多変量解析で分析できることは、上図のようにいろいろあります。

逆にいうと、「扱うデータ」と「目的(何を知りたいか)」によって、とるべき分析手法が変わってくるので、
単独万能な解析方法があるわけではないんですね。

ここまで調べてようやく、

Lukia_74

Lukia

私がこれから学ぶのは、「多変量解析」そのものではなくて、多変量解析に含まれている、重回帰分析、判別分析、AID分析なんだな。

と理解できました。

多変量解析で扱う4種類のデータ

そして、一口に「データ」といっても、実際には4種類に分類できることも知りました。

まず、ざっくりと量的データ(定量的データとも)と質的データ(定性的データとも)の2つに分類され、
さらにそこから、間隔尺度・比例尺度・名義尺度・順序尺度の4つに分類されます。

以下の図は、『図解入門ビジネス多変量解析の基本と実践がよ~くわかる本』森田浩著を参考にして、
上図と同じ内容をまとめたものです。



多変量解析を用いる目的

なぜ多変量解析を行うのか。
その目的は大きく2つに分かれます。

ひとつは、「予測」のため。
もうひとつは、「要約」のため。です。

さらに、この目的をもう少し細かく分け、それに見合った分析方法を表にまとめたものが
先に挙げた森田本にありましたので、その「多変量解析手法の分類」表を引用してみます。

これから私が学ぶのは「予測」に関する多変量解析

多変量解析を行うのは、「予測」と「要約」という目的を満たすためであることがわかりました。

すると、だんだん頭の中でつながってきます。
本のタイトルに「馬券戦略」とあるように、勝ち馬を予測することが目的であること、

そして、森田本の「多変量解析手法の分類」表で「重回帰分析」と「判別分析」が「予測」目的に含まれていることから、

Lukia_74

Lukia

これから私が学ぶのは「予測」に関する多変量解析だ!

と気がつきました。

Lukia_74

Lukia

ここにたどり着くまで、3〜4時間はかかったかもしれません。

時間はかかってしまいましたが、そのぶん、「予測する方法を学ぶんだ!」という
そもそもの目的を明確にできたので、よかったのではないかと思います。

そして目的は明確になったものの、四苦八苦な学習が始まるのでした。

著書のおしらせ

『重回帰分析を知った30日後、競馬予想デビューしてみた。』の表紙画像 2023年7月11日に 『重回帰分析を知った30日後、競馬予想デビューしてみた。』 をKDP出版いたしました。
この本は、「重回帰分析」を学んだ段階で、
実生活にいろいろと活かせた私自身の体験や感動から生まれた本です。

多くの専門家は、さまざまな「多変量解析」の手法を紹介・解説して一冊の本にまとめあげていますが、
私の本で扱うのは、多変量解析の初歩にあたる「重回帰分析」に限定しています。
ですから、将来専門家を目指すような方には、不足が多いと思います。

しかし、「重回帰分析」を学んだだけでも、
学んだ人のニーズに合わせて、さまざまな「予測」が可能になります。

この体験が、さらに「多変量解析」そのものへの興味・関心を深め、
データ分析を通じて、論理的に最適解を求める姿勢が育めると考えています。

著作としては拙い部分もあるのですが、
「多変量解析の入門書」の入門書のような位置づけとしてお読みいただければ幸いです。

『重回帰分析を知った30日後、競馬予想デビューしてみた。』の表紙画像
重回帰分析を知った30日後、競馬予想デビューしてみた。

あなたには、以下のような体験はありませんか。
「長年の経験やカンからまちがいはないものの、根拠としては弱いような気がして、強く主張できなかった」
「法則性や傾向があることはわかっているけれど、要因が複数あるため、どれが決め手になるのかつかみ切れず、もやもやした」
「自分や他者が決断を下すとき、現実味のある数値を用いて、その先に起こることが示されていれば、積極的にスピーディーに決断できるのにとじれったい思いをした」

これらのお悩み、「多変量解析」で解決できるかもしれません。

本書では、「多変量解析」の中でも「予測」のデータ分析手法である「単回帰分析」と「重回帰分析」を御紹介します。

しかも、Googleスプレッドシートとアドオン「XLMiner Analysis ToolPak」を用いますので、
未経験の方、専門外の方でも簡単に重回帰分析が行えます。

本書は、「多変量解析の入門書」の入門書のような位置づけをめざしていますので、
以下のようなことに力を入れています。
重回帰分析を行うにあたり、どんな種類のデータを用いるべきかをていねいに示す。
単回帰分析について数学的な解説(紹介レベル)
架空の4人家族の話を通じて、回帰分析の理解やアドオンのすごさをお伝えする。
著者 新が 重回帰分析を競馬予想に用いた体験や反省点を示す。

私自身は、重回帰分析を独習するのに30日かかりましたが、
この本は、私が独習するにあたり、
(こんな本があったらもう少し早く重回帰分析デビューできたのに)と思って書きました。

ですから、本書には、読後数時間で重回帰分析デビューできるように、知っておくべき事柄を盛り込んでいます。

全ての事象には 原因や要因、きっかけとよばれることがらがあり、
また導かれた結果には複数の要因がからんでいることがあります。

重回帰分析を行うことによって、ある条件を満たした数値によって表された「要因と思われるもの」と、「結果となるもの」の間の関係性の有無やその程度が明らかにできます。

原因と結果は、どんな人の人生にも生活にも必ず存在するものです。

「データ分析なんて、自分の人生に関わりがないだろう」と思っていらっしゃるあなたにこそ読んでほしいと思います。

レモンのライン
以下の記事一覧に他のボリュームのブログカードを載せています。
途中のボリュームからお読みになった方はこちらからどうぞ。


 

プロフィール

Author Profile
Lukia_74

元・再受験生、元塾講師、元高校非常勤講師。広島育ち。
中・高国語の教員免許を取得するも、塾講師時代は英語や数学ばかり教えていた。
思うところあって大学再受験を決意。理転し、数学Ⅲ、化学、生物を独習する。国立大学へ合格するも、2018年3月に再受験生生活にピリオドを打つ。
モットーは「自分の予定はキャンセルできても、生徒の予定はキャンセルできない」と「主婦(夫)こそ理系たれ」。
広島のお好み焼きとグレープフルーツが大好き。どっちかというと左党。楽しみはひとりカラオケ。
高校で教鞭を取った経験から、現在は「現代文」と「小論文」の指導力アップを目指し、自己研鑽中。最近は趣味として高校数学を解く。

カテゴリー

2023年3月1日多変量解析

Posted by Lukia_74