機械学習自動化ツール 〜回帰編〜

前回の記事で機械学習自動化ツール〜分類編〜を扱いました。

そこで今回は〜回帰編〜です。

 

回帰というのは簡単に言ってしまえば数値の予測です(分類はカテゴリの予測でした)。

 

では今回の自動化ツールを使って回帰による予測をしていましょう。

f:id:ois-blog:20191120090217p:plain

学習データ

前回と同様の学習データです。

全ての項目のデータが揃っています。

 

f:id:ois-blog:20191120090430p:plain

予測用データ

こちらが予測用のデータ。身長のデータだけありません。

ここから

 

性別、体重、年齢 → 身長

 

の予測を行なっていきます。

 

この2つのデータを機械学習自動化ツールにインプットしてみましょう。

 

結果がこちら。

f:id:ois-blog:20191120090849p:plain

身長の予測結果

 

なんとも言えない結果ですね。当たっているような当たっていないような。

ちなみに「男」に1.0と入っているデータは男で、「女」に1.0と入っているデータは女です。この辺はUIを改善した方が良さそうですね。

 

特徴量の影響度合いは、

f:id:ois-blog:20191120091622p:plain

特徴量の影響度合

意外なことに年齢が大きく影響していました(個人的には体重の影響が大きいのと持ってました)。

 

正解率は、

f:id:ois-blog:20191120091754p:plain

正解率

ほぼ6割のなので悪くはないですが、分類の時よりは劣ってますね。

 

最後に各アルゴリズムの比較結果です。

f:id:ois-blog:20191120092008p:plain

アルゴリスム比較結果

今回はサポートベクターマシンはふるわなかったようですね。

線形回帰に正則化項をを使いしたリッジ回帰が一番でした。

ラッソ回帰正則化項を入れるという点では同じなのですがかなり引き離されています。

 

回帰に関してはまだ改善の余地があるかな、という状態です。

オリジナルのアルゴリズムを入れることなども検討していきたいと思います。