2020年2月アーカイブ

今回のテーマは「中古車の価格予測」です。

車の名前、発売年、走行距離、燃料の種類、トランスミッション、排気量などから中古車の価格を予測します。

文字列、カテゴリー、単位付きの値を含んでいて、かつ、一部には欠損値もあり、前処理が一つのポイントになりそうです。

評価基準はRMSLE(平均二乗対数誤差平方根)です。

期限は 2020/4/7 11:59 JST です。

今回のテーマは「糖尿病診断」です。

コレステロール値、年齢、性別、身長、体重、血圧などから、糖尿病であるかどうかを診断します。

オリジナルのデータセットの特徴にはグルコースも含まれていましたが、糖尿病との関係が強いので、このデータセットからは抜いてあります。

評価基準はAUC(ROC曲線の下の面積)です。

期限は 2020/3/15 11:59 JST です。

今回のテーマは「学生の成績予測」でした。

特徴がカテゴリー(名義)、順序、数値、二値などいろいろな種類が含まれているのが特徴でした。

オリジナルのデータセットの説明変数には1学期と2学期の成績も含まれていますが、(目的変数である3学期の成績と非常に相関が高いので、)ここでは1学期と2学期の成績を使用せずに3学期の成績を予測しました。

最終結果(ポイント変動分のみ)

#氏名学年スコア獲得ポイント
1.吉田 拓倫M12.9265810010
2.近藤 巧麻B42.979450109
3.大場 智晃B33.099510017
4.伊藤 茜B43.200070005
5.永縄 拓也B43.262820003
6.伊藤 徳晃M13.281080003
7.鬼塚 青杜B33.290580003
8.小島 崇史B33.299740003
9.菅沼 杏亮B33.350680003
10.蔦木 宏斗B33.357700003
DSQ木村 昂輝B4-000−2
DSQ瀬戸 要B4-000−4
DSQ石黒 成哉B3-000−4
DSQ末武 大樹B3-000−4
DSQ林 拓実B3-000−4
DSQ村井 純希B3-000−4

Kaggleには全員のスコアとランキングが載っています。

総合ランキング

#氏名学年合計ポイント称号
1.-吉田 拓倫M154295エキスパート
2.-近藤 巧麻B412179エキスパート
3.-蔦木 宏斗B420244
4.-小島 崇史B401143
5.△1伊藤 徳晃M112134
6.△1永縄 拓也B410033
7.▼2瀬戸 要B400028
8.△3伊藤 茜B400123
9.▼1林 拓実B301122
10.▼1鬼塚 青杜B310027
11.▼1村井 純希B300022
12.-大場 智晃B300121
13.△2菅沼 杏亮B300012
14.▼1馬原 拓樹B300010
15.▼1末武 大樹B30015
15.-石黒 成哉B30005
17.-木村 昂輝B40003

中部大学
生命健康科学部 臨床工学科
工学部 情報工学科
データ・マイニング研究室

アーカイブ