Kaggle 銅メダルへの道(5日目)
こんにちは、筋肉めがねです。
いきなりですが、本日は3行日記を書いてみます。3行日記とは、以下の3点を毎日書く、という事だそうです。
本日、一番感動した事
本日、一番失敗した事
明日の目標
という事で書いてみましょう。
本日、一番感動した事は久しぶりの胸トレで100kg x 7repsを挙げれた事
本日、一番失敗した事はジムで3種類の胸トレしかできなかった事
明日の目標は、Kaggleをする事
それでは、本日も以下の記事を参考に進めていきましょう。
本日は、objective analysisという事で主観を除いて定量的にデータを分析してみました。
一つ目の図はheatmapです。相関の高い箇所は色が濃くなっています。ざっくり見て分かる事は、TotalBsmtSFと1stFlrSFは相関がとても高いという事、つまり例えばTotalBsmtSFがSalePriceに与える影響が、1stFlrSFがSalePriceに与える影響とほぼ等しい、という事ですね。GarageCarsとGarageAreaも同様にとても相関が高い、という事が分かります。
続いて、Seabornというライブラリが、SalePriceと相関が高いと判断した9つの条件、およびSalePriceとの相関を相対比較させた図です。先ほどと同じように、TotalBsmtSFと1stFlrSF、およびGarageCarsとGarageAreaはほぼ同じ情報を与える、という事が分かります。
それらの条件から幾つかに絞り込み、各々の相関をxy座標にプロットした図が以下でございます。見ていて面白いですね。
それでは、本日は以上でございます。