こんにちは!
ブロガーのたけしです。
今日は機械学習の分類モデル、
回帰モデルについて、小学生
でもわかるように説明して
とChatGptに検索した結果を
ご紹介したいと思います。

分類モデルとは?
まず、分類モデルは
「グループ分け」をする
モデルです。
たとえば、あなたが友達に
「この動物は猫かな?犬かな?」
と聞いたとします。
その友達が写真を見て、「これは
猫だよ!」と答えるなら、友達は
分類をしたことになります。
モデルに同じような役割をさせると、
それが分類モデルです。
回帰モデルとは?
次に、回帰モデルは
「数を予測する」モデルです。
たとえば、あなたがアイス
クリーム屋さんに行って「今日、
何個のアイスが売れるかな?」と
予測したとします。
そのときに「今日は50個売れるかも!」
と答えたなら、これは数を予測したこと
になります。
モデルに同じように数を予測させるのが
回帰モデルです。
分類モデルと回帰モデルの違い
- 分類モデルは「グループ分け」をする
ために使います。例えば、メールが
「スパムかどうか」を判断するモデル
や、病気の診断をするモデルなどです。 - 回帰モデルは「数を予測する」ために
使います。例えば、家の値段を予測
したり、将来の気温を予測したりする
モデルです。

簡単に言うと、「分類モデル」は
「これは何?」と質問に答えるモデル、
「回帰モデル」は「いくつ?」
と質問に答えるモデルです!
(ChatGpt:2024年8月21日の検索結果)
実にわかりやすい説明です。さらにモデルの
精度を評価する指標にはどんなものがあるか
聞いてみます。
分類モデルの精度を評価する指標
1. 正解率(せいかいりつ)
- 正解率は、モデルがどれくらい正しく
答えたかを見る指標です。 - たとえば、10回のクイズで8回正解
したら、正解率は「8/10=80%」です。
分類モデルでも同じで、モデルがどれだけ
正しく分類できたかを見ます。
2. 精度(せいど)
- 精度は、モデルが「これは〇〇だよ」
と答えたとき、その答えがどれくらい
正しかったかを見る指標です。 - 例えば、「これは猫だよ」と言ったとき、
実際に猫であった割合を計算します。
3. 再現率(さいげんりつ)
- 再現率は、実際に「猫」として
正しく答えた数が、全体の「猫」の数
に対してどれくらいかを見る指標です。 - つまり、「猫」を見逃さずに正しく
キャッチできたかどうかを測ります。

回帰モデルの精度を評価する指標
1. 平均絶対誤差(へいきんぜったいごさ、
Mean Absolute Error: MAE)
- 平均絶対誤差は、モデルが予測した数
と実際の数の「ズレ」を見る指標です。 - たとえば、モデルが「50個のアイス
が売れる」と予測したけど、
実際には「45個」売れたら、
「ズレ」は「5」です。
このズレをたくさんの予測について
平均したものが平均絶対誤差です。
2. 平均二乗誤差(へいきんにじょうごさ、
Mean Squared Error: MSE)
- 平均二乗誤差は、ズレの「二乗」
をしてから平均を取ったものです。
二乗することで、大きなズレに対して
ペナルティを重くして評価します。 - たとえば、「ズレ」が「5」なら
二乗して「25」にして、それを
平均します。
簡単にまとめると
- 分類モデルでは「どれだけ正しく
グループ分けできたか(正解率、精度、
再現率)」を見ます。 - 回帰モデルでは「どれだけ正確に
数を予測できたか
(平均絶対誤差、平均二乗誤差)」
を見ます。
それぞれの指標は、モデルが
どれくら上手に仕事をしたか
を測るためのものです!
私が今行っている自動車事故を起こす人の
特徴分析はこの説明からすると
「事故を起こす人」と
「事故を起こさない人」
に分類するわけで、分類モデルの
1つですね!!
是非、みなさんも自分の行っている
もしくは行おうとしている分析が
「分類モデル」なのか
「回帰モデル」なのかの参考に
してくださいね!!
それでは、また!!