Kaggle 銅メダルへの道(5日目)

こんにちは、筋肉めがねです。

 

いきなりですが、本日は3行日記を書いてみます。3行日記とは、以下の3点を毎日書く、という事だそうです。

 

本日、一番感動した事

本日、一番失敗した事

明日の目標

 

という事で書いてみましょう。

本日、一番感動した事は久しぶりの胸トレで100kg x 7repsを挙げれた事

本日、一番失敗した事はジムで3種類の胸トレしかできなかった事

明日の目標は、Kaggleをする事

 

それでは、本日も以下の記事を参考に進めていきましょう。

www.kaggle.com

 

本日は、objective analysisという事で主観を除いて定量的にデータを分析してみました。

 

f:id:KinnikuMegane:20190115072325p:plain

一つ目の図はheatmapです。相関の高い箇所は色が濃くなっています。ざっくり見て分かる事は、TotalBsmtSFと1stFlrSFは相関がとても高いという事、つまり例えばTotalBsmtSFがSalePriceに与える影響が、1stFlrSFがSalePriceに与える影響とほぼ等しい、という事ですね。GarageCarsとGarageAreaも同様にとても相関が高い、という事が分かります。

f:id:KinnikuMegane:20190115072402p:plain

続いて、Seabornというライブラリが、SalePriceと相関が高いと判断した9つの条件、およびSalePriceとの相関を相対比較させた図です。先ほどと同じように、TotalBsmtSFと1stFlrSF、およびGarageCarsとGarageAreaはほぼ同じ情報を与える、という事が分かります。

それらの条件から幾つかに絞り込み、各々の相関をxy座標にプロットした図が以下でございます。見ていて面白いですね。


それでは、本日は以上でございます。

にほんブログ村 IT技術ブログへ
にほんブログ村



Pythonランキング