ドイツの物件情報分析(2日目)

こんにちは、筋肉めがねです。

 

前回の記事では、Immobilienscoutから取得した物件情報を9,097件まで絞り込みました。ですが、一旦、取得した全件10,587件の情報を使って分析してきましょう。

 

これらのデータを使って、先ずは、ドイツの州毎にどのような違いがあるのか見ていきましょう。例えば、州と価格の相関を取りたい時は、以下の記事で実践した事を思い出しながら進めていけばよいですね。

kinnikumegane.hatenablog.com

 

州毎に、どのような価格帯の物件が売りに出されているのか、こちらが一覧でございます。

f:id:KinnikuMegane:20190303034616p:plain

Boxplotで描画してみたところ、BerinそしてBayernには外れ値と判断された物件が沢山ある事がわかりますね。例えばBayernには、9Mil EUR近い物件がある事が分かります。Boxplotにおける外れ値の判断基準は以下で説明されています。

mizti.hatenablog.com

外れ値があるので少し見づらいですね。では、外れ値を取って描画してみましょう。

f:id:KinnikuMegane:20190303042741p:plain

だいぶ見やすくなりました。上の図のBoxplotでは、5つの指標が表されています。Boxからそれぞれ上の方、下の方に伸びている線の先端にあるバーは、上のバーが母集団における最大値、そして下のバーが最小値を表しています。そしてBox部分は、下辺が母集団における25%目の位置にある数値、そして中央付近にあるバーが中央値、そして上辺が母集団における75%目の位置にある数値です。

中央値とは、普段の生活では馴染みのない指標ですが、例えば人が99人いた時に、年齢順に並んてもらったとします。その時に、50人目(母集団の真ん中にいる人)の年齢を中央値と呼びます。

 

Berlin, Hamburg, Bayernの中央値は400kEUR程度という事が分かりますね。続いてHessen, Baden Württenbergにおいて、価格の高い物件が売りに出されている事が分かります。

 

では、州毎にどれだけの物件数があるのか描画してみましょう。

f:id:KinnikuMegane:20190303035819p:plain

 

Nordrhein Westfalenが1,900件程度、とダントツでトップですね。日本の方には馴染みのあるDüsseldorfのある州ですね。続いて、Baden Würdenberg, Bayern, Berlinと続いています。

 

続いて、州毎の物件の床面積の情報をプロットしてみましょう。

f:id:KinnikuMegane:20190303075211p:plain

縦軸は平米です。Bayern, Sachsen, Brandenburgに800平米を超える物件がありますね。9Mil EURを超える物件のあるBayernでは理解できますが、物件価格の上限が2Mil EURであるSachsen, Brandenburgのマーケットに、800平米を超える物件があるのは興味深いところですね。お買い得なのでしょうか。

 

外れ値が沢山あるので、価格と同様に、外れ値は削除してしましょう。

f:id:KinnikuMegane:20190303080219p:plain

価格で見た州毎のばらつきと比較すると、床面積は州毎にそこまで大きなばらつきはないようです。Berlin, Hamburg, Bayern, Hesse, Baden Württenbergは、それ以外の州と比較をすると、1平米あたりの値段がダイブ高い、という事ですね。

 

最後に、州毎の物件の築年数を見てみましょう。

データの型変換、そして欠損値の補完をした上で、プロットします。

f:id:KinnikuMegane:20190303082218p:plain

鎌倉幕府時代に作られた物件が1つありますね。本当か、と。

 

これまでの分析同様に外れ値が沢山ありますね。削除しましょう。

f:id:KinnikuMegane:20190303082407p:plain

Sachen, Thüringen, Sachsen Anhalt Bremenは、2000年以降に作られた物件がほとんどない事が分かりますね。でも一方で、Berlinは、古い物件から新しい物件までバリエーションが豊富な事が分かりますね。

 

それでは、本日は以上でございます。

 

にほんブログ村 IT技術ブログへ
にほんブログ村



Pythonランキング