今回のテーマは「学生の成績予測」です。
学生の環境や生活などから数学またはポルトガル語の授業の成績を予測します。 特徴がカテゴリー(名義)、順序、数値、二値などいろいろな種類が含まれているのが特徴です。
オリジナルのデータセットの説明変数には1学期と2学期の成績も含まれていますが、(目的変数である3学期の成績と非常に相関が高いので、)ここでは1学期と2学期の成績を使用せずに3学期の成績を予測します。
評価基準はRMSE(平均二乗誤差平方根)です。
期限は 2020/2/03 11:59 JST です。