データ解析コンペ
研究室内でデータ解析コンペを行ない、データ解析に必要な前処理や機械学習の技術を磨いています。
対象は、研究室に所属する情報工学科のゼミ生(3年生)、卒研生(4年生)、情報工学専攻の大学院生です。
卒業研究のテーマだけだと、自分の研究テーマの対象となった技術には強くなるけどそれ以外のことは何もできないまま社会にでてしまうので、少なくともデータ解析の技術は一通り身につけてから社会に出ていき、データ解析ができるエンジニア(できれば機械学習エンジニアやデータ・サイエンティスト)として活躍してもらいたいと考えています。
最初はDeepAnalytics(現在のSIGNATE)で授業用コンペを行い、SIGNATEになってからは練習用コンペに参加していましたが、現在はKaggleでプライベートなコンペを行なっています。
自分が試したテクニックや直面したトラブルなどをゼミで報告して共有し、前処理や機械学習のスキルを磨いています。
2019年度から新たにランキング制度を導入し、Webサイトで紹介することにしました。
1056Lab ランキング
# | △ | 氏名 | 学年 | 金 | 銀 | 銅 | 合計ポイント | 称号 |
---|---|---|---|---|---|---|---|---|
1 | - | 鬼塚 青杜 | M2 | 5 | 5 | 3 | 193 | マスター |
2 | - | 落合 瞬也 | M1 | 2 | 2 | 5 | 111 | エキスパート |
3 | - | N.H. バオ・ロン | M1 | 4 | 3 | 0 | 96 | エキスパート |
4 | - | 位田 奨 | M2 | 0 | 1 | 3 | 61 | |
5 | △3 | 手嶋 一佳 | B3 | 1 | 1 | 1 | 34 | |
6 | ▲1 | 橋本 樹 | M2 | 0 | 0 | 1 | 34 | |
7 | ▲1 | 船橋 和哉 | B4 | 1 | 0 | 0 | 33 | |
8 | ▲1 | 石原 大貴 | B4 | 0 | 1 | 1 | 33 | |
9 | - | 石田 匠吾 | B4 | 0 | 1 | 0 | 20 | |
10 | - | 渡部 元基 | B4 | 0 | 0 | 0 | 12 | |
11 | △2 | 柳原 駿斗 | B4 | 0 | 0 | 0 | 12 | |
12 | ▲1 | 三澤 睦生 | B3 | 0 | 0 | 0 | 9 | |
12 | ▲1 | 百瀬 魁人 | B3 | 0 | 0 | 0 | 9 | |
14 | - | 中村 亮太 | B4 | 0 | 0 | 0 | 0 | |
14 | - | 伊藤 優志 | B3 | 0 | 0 | 0 | 0 | |
14 | - | 江崎 空 | B3 | 0 | 0 | 0 | 0 | |
14 | - | 丸山 大輝 | B3 | 0 | 0 | 0 | 0 | |
14 | - | 和氣 銀汰 | B3 | 0 | 0 | 0 | 0 |
(第42回終了時)
1056Lab 卒業生ランキング
# | 氏名 | 卒業年度 | 金 | 銀 | 銅 | 合計ポイント | 称号 |
---|---|---|---|---|---|---|---|
1 | 吉田 拓倫 | 2020M | 13 | 6 | 5 | 214 | グランドマスター |
2 | 近藤 巧麻 | 2021M | 5 | 5 | 3 | 192 | マスター |
3 | 下村 晃太 | 2021B | 2 | 2 | 2 | 67 | エキスパート |
4 | 伊藤 徳晃 | 2020M | 2 | 2 | 2 | 57 | エキスパート |
5 | 蔦木 宏斗 | 2019B | 2 | 0 | 2 | 44 | |
6 | 小島 崇史 | 2019B | 0 | 1 | 1 | 44 | |
7 | 菅沼 杏亮 | 2020B | 1 | 2 | 0 | 40 | |
8 | 林 拓実 | 2020B | 0 | 1 | 3 | 40 | |
9 | 大場 智晃 | 2020B | 0 | 0 | 1 | 39 | |
10 | 永縄 拓也 | 2019B | 1 | 0 | 0 | 33 | |
11 | 瀬戸 要 | 2021M | 0 | 0 | 0 | 33 | |
12 | 末武 大樹 | 2020B | 0 | 0 | 2 | 23 | |
13 | 伊藤 茜 | 2019B | 0 | 0 | 1 | 23 | |
14 | 小川 純矢 | 2021B | 0 | 0 | 0 | 20 | |
15 | 伊藤 寿紀 | 2021M | 0 | 0 | 0 | 14 | |
16 | 村井 純希 | 2020B | 0 | 0 | 0 | 6 | |
16 | 社本 琉 | 2021B | 0 | 0 | 0 | 6 | |
18 | 木村 昂輝 | 2019B | 0 | 0 | 0 | 3 | |
19 | 馬原 拓樹 | 2020B | 0 | 0 | 0 | 2 | |
20 | 加藤 駿英 | 2021B | 0 | 0 | 0 | 1 | |
21 | 石黒 成哉 | 2020B | 0 | 0 | 1 | 0 | |
22 | 岡 汰空海 | 2021B | 0 | 0 | 0 | 0 |
(第38回終了時)
ルール
各コンペの共通ルール
- Don't cheat!(インチキするな)
- Help each other!(お互いに助け合おう)
- Have fun!(楽しもう)
予測結果の投稿は最大5回/日、投稿した複数の予測モデルの中から選べるのは2つまで。
Kaggle Notebookを使用し、コンペ終了後、最終スコアを獲得したNotebookを公開すること。
取り組み状況や結果をゼミで報告すること。
ランキング制度
各コンペの上位3名にメダル、上位5名にポイントが与えられ(第7回から)、合計ポイントによりランキングを作成します。
- 1位:金メダル、10ポイント
- 2位:銀メダル、8ポイント
- 3位:銅メダル、6ポイント
- 4位:4ポイント
- 5位:2ポイント
スコア差が5%以内の場合、上位のポイントから1引いた値をポイントとします。 ただし、評価基準がAUCの場合はスコアを 1-AUC とします。
以前は期限内に提出できなかった場合とNotebookを公開できなかった場合にペナルティを課していましたが、得点集計を簡単課するため、第27回から廃止しました。
称号制度
またメダルと合計ポイントにより、称号を授与します。
- グランドマスター (Grandmaster):金メダル5枚、かつ、200ポイント
- マスター (Master):金メダル3枚、かつ、120ポイント
- エキスパート (Expert):金メダル1枚、かつ、50ポイント
コンペ履歴
- 第43回 航空機乗客の満足予測 (2022/12/15-2023/1/12)
- 第42回 手の画像分類 (2022/7/8-8/29)
- 第41回 患者の死亡予測 (2022/6/1-7/25)
- 第40回 航空券の価格予測 (2022/6/1-27)
- 第39回 保険のクロス・セル予測 (2022/5/23-30)
- 第38回 飛行機の到着遅延予測 (2021/12/23-2022/1/17)
- 第37回 中古車の価格予測 (2021/11/28-12/20)
- 第36回 顧客の行動予測 (2021/10/28-11/20)
- 第35回 鳥の画像分類 (2021/9/14-10/4)
- 第34回 COVID-19の画像診断 (2021/8/4-9/6)
- 第33回 ローンの信用リスク予測 (2021/7/5-8/2)
- 第32回 住宅価格予測 (2021/6/11-7/5)
- 第31回 新型コロナウイルス患者の入院日数予測 (2021/5/31-6/7)
- 第30回 麺類の料理画像分類 (2021/4/23-5/10)
- 第29回 企業の倒産予測 (2021/2/19-4/5)
- 第28回 糖尿病患者の再入院予測 (2021/2/19-3/22)
- 第27回 クレジットカードの解約予測 (2020/12/29-2021/1/26)
- 第26回 不動産の取引価格予測 (2020/12/4-28)
- 第25回 給与保護プログラムの融資規模予測 (2020/10/23-11/30)
- 第24回 民泊の料金予測 (2020/9/29-10/26)
- 第23回 歴史的建造物の画像分類 (2020/7/28-9/28)
- 第22回 サッカー選手の価値予測 (2020/6/23-8/4)
- 第21回 自動車保険のリスク予測 (2020/6/15-7/13)
- 第20回 心電図からの不整脈検出 (2020/4/8-6/16)
- 第19回 マイクロアレイ遺伝子発現解析による脳腫瘍の分類 (2020/4/8-5/12)
- 第18回 中古車の価格予測 (2020/2/16-4/7)
- 第17回 糖尿病診断 (2020/2/15-3/15)
- 第16回 学生の成績予測 (2019/12/13-2020/2/3)
- 第15回 クレジットカード取引の詐欺検出 (2019/12/6-2020/1/6)
- 第14回 欠陥検出 (2019/11/12-12/9)
- 第13回 ワインの品質予測 (2019/10/28-11/11)
- 第12回 乳ガン診断 (2019/10/14-28)
- 第11回 NBA年俸予測 (2019/7/19-9/10)
- 第10回 最低気温予測 (2019/6/14-8/6)
- 第9回 肺炎診断 (2019/5/8-7/23)
- 第8回 従業員の離職予測 (2019/4/24-6/11)
- 第7回 企業の倒産予測 (2019/4/10-5/7)
- 第6回 お弁当の需要予測
- 第5回 銀行取引の詐欺検出
- 第4回 ボットの判別
- 第3回 Jリーグの観客動員数予測
- 第2回 お弁当の需要予測
- 第1回 銀行の顧客ターゲティング