Kaggle 銅メダルへの道(8日目)

こんにちは、筋肉めがねです。

 

Google AIが以下の記事をtweetしておりました。

blog.google

 

世界中のあらゆる事象を記録した様々なデータセットを、全ての方がアクセスできるようオープンにする、という記事です。過去に起きた事象を基に、起こるであろう未来を予測する、というモデルを作るには必須なものですね。

以下のページで、データセットを検索可能のようです。

toolbox.google.com

 

それでは、ドイツの物件情報分析は一旦置いておいて、Kaggleを進めていきましょう。

ここ数日、Kaggleのopen compeitionを一つ一つ読んでおりました。中でも、NCAAという全米大学バスケットボールのトーナメントについて、今年の3月から4月にかけて行われる全ての試合の結果を予想する、というConpetitionに興味を惹かれたので、それを進めていきます。このトーナメントは別名March madnessと呼ばれているようです。

そう言えば、スラムダンクが世間を賑わせていた90年代後半、僕は万年バスケ部のベンチウォーマーであったなー。ベンチを温める事が誰よりも得意だった事を思い出しますね。冬は、座る所が暖かい方が良いですよね。

 

ざっくりとCompetitionの概要を読みましたが、NCAAバスケにおいて、出場チームが選出される過程、と勝ち上がりの方式を理解する事が大事なようです。以下、書いておきます。

1. 先ず、トーナメントに先駆けて、全米で32の小さい大会が開催されます。それら各々の大会での優勝チーム32校が選ばれます。その際、ある基準を用いて、1から32までの順位が付けられます。

2. 続いて、全米の全ての大学から、36校が委員会により推薦されます。この時も、ある基準を用いて、1から36までの順位が付けられます。

3. ステップ1における32校のうち、下位の4校と、ステップ2における36校のうち下位の4校の合計8が、先ずトーナメントを行います。そして、そこで選ばれた上位の4チームと、残りの60チーム、計64チームがトーナメントを行い、優勝者を決める、というものです。

 

そのため、1回のトーナメントにおける試合数は67回なんですけれども、今回のKaggleのCompetitionでは、全ての考えうる試合の結果を予想する、というもの、つまり試合数は総当たり方式と同じとなります。68 x 67 = 2,278ですね。

 

次回の記事でCompetitionを進めていきます。

それでは、本日は以上でございます。

 

にほんブログ村 IT技術ブログへ
にほんブログ村



Pythonランキング