第19回データ解析コンペ

今回のテーマは「マイクロアレイ遺伝子発現解析による脳腫瘍の分類」です。

マイクロアレイ遺伝子発現解析は、ガラス製の基盤(チップ)上にDNAの断片を大量に並べて反応させ、どのDNAがより多く結合しているかを調べるものです。大量のDNA断片を一度に反応させるので、特徴が大量になります。一般に、事例数よりも特徴数が多いとオーバーフィットが生じて問題になります。

今回のデータは、脳腫瘍の患者さんのDNAデータです。 脳腫瘍には様々な種類がありますが、そのうちのいくつかには特定の遺伝子に異常があることがわかってきています。 今回のデータには、上衣腫 (ependymoma)、膠芽腫 (glioblastoma)、髄芽腫 (medulloblastoma)、毛様細胞性星細胞腫 (pilocytic astrocytoma) の4種類の脳腫瘍と正常 (normal) の5つのクラスに分類します。

5クラスで91例(訓練データ)しかないのに、54,676次元もあります。

評価基準は平均F1-スコアです。

期限は 2020/05/12 11:59 JST です。

中部大学
生命健康科学部 臨床工学科
工学部 情報工学科
データ・マイニング研究室

アーカイブ