データ分析の実際について

こんにちは!
ブロガーのたけしです。

本日は私の実際に行った
データ分析、および現在
行っている最中のデータ
分析事例のご紹介をさせて
頂きたいと思います。

私は損害保険会社所属の社員の
ため、一つは「自動車保険の
特約をつける顧客の特徴分析」
もう一つは、「事故を起こしやすい
契約者の特徴分析」を行いました。

データ分析って皆さんの
イメージではどんな感じ
でしょうか?

なんか、かっこいいな、
プログラミングの知識
をフル活用するのかな?

って思うかもしれません。

僕もそう思っていました。

しかし、実際はデータを
引っ張ってくるところが
結構大変なのと、あと分析
できるようにデータを
揃える(データクレンジング)
ことに膨大な時間を費やします。

でも、ここで間違ったデータ
を引っ張ってきたり、欠損値
の処理を誤ると、正しい分析
ができないため、肝心なところ
で手を抜くわけにはいきません。

分析のすべての作業を10割と
すると7割がデータ取得とその
整形作業、2割が分析業務、1割
がその結果の分析といった感じ
でしょうか?

実際のデータ分析は意外と
泥臭いものなんだなあ
というのが私の感想です。

肝心の機械学習や予測モデル
の作成は、コードを数行書く
だけで終わってしまいます。

ただ、その予測モデルの精度
を上げるのに、いろいろと
思考錯誤します。

この次のブログで、私の
「事故を起こしやすい契約者
 の分析」の実際をオープン
にしたいと思います。

タイトルとURLをコピーしました