Home 理工学部 │ データ数理専攻

データサイエンス研究室

対象学年
3・4年次
担当教員名
小森 理 准教授
Osamu Komori
学びのキーワード
  • 医療統計
  • 生物統計
  • データサイエンス
情報発信
> Webサイト 

研究の内容

データには必ず不確実性が伴います。その不確実性を確率論の枠組みで定式化し、データの背後にある本質を捉えることを目指しています。そのために統計科学、機械学習、情報理論、情報幾何学の考え方や手法を駆使します。またデータの本質を捉えるためにはデータを効率的に扱う能力も必須です。本研究室ではそのために主にデータ解析ソフトRとPythonを用います。これらの解析ソフトを通してデータの概要を正しくかつ客観的に把握することがデータ解析の第一歩となります。自分のアイディアを数式で論理的に展開し、それをプログラムを用いて実装し、実際に社会に役に立つ形にまで持っていくことを目指します。プログラミングが好きな学生、論理的思考が得意な学生、データ解析に興味がある学生を歓迎致します。

研究の進め方

3年生の研究配属後には、データ解析の基本を勉強するため「Rによる 統計的学習入門」などの定評のある教科書を読み進めます。具体的には統計的学習の歴史、ベクトルと行列の計算、予測と推論の枠組み、パラメトリック推定とノンパラメトリック推定、予測精度とモデルの解釈性のトレードオフ、教師あり学習と教師なし学習、モデルの精度と評価、バイアスと分散のトレードオフ、最適な予測精度を達成するベイズ判別機などを勉強します。また教科書に付随している実データセットを使い、実際のデータ解析を通してその背後にある理論的な事柄の理解も深めてもらいます。また英語文献を読み進める能力を養うために様々なテーマの文献を読み、その内容をまとめ、発表してもらいます。このような研究室の活動を通して少しずつ自分の興味あるテーマを見つけてもらいます。研究テーマ探しも卒業研究を進めるうでとても大切なプロセスと位置づけています。
4年生からは本格的に自分自身の研究テーマに取り組んでもらいます。3年生までは集団での卒研指導でしたが、4年生からそれぞれの学生の興味と個性を伸ばすために個別指導に切り替えます。zoomと対面指導を織り交ぜ、データの収集、データ解析で必要な手法の勉強、プログラミングスキルの修得をしてもらいます。4年生前期の中間発表、後期の卒研発表が主な研究発表の機会ですが、研究が進んでいる学生に対しては国内学会、国際学会での発表も奨励します。

iamge

未来の研究室生へ

データサイエンスはとても幅広い分野で活用される学問分野です。大学の授業、研究室の活動を通してデータ解析の基本的なプロセスを修得してもらいます。まずデータの不確実性を正しく理解するには確率論の知識が不可欠です。またデータの背後にある確率構造を適切に取り扱うには統計モデリングの素養も必要です。統計モデリングの様々な手法を正しく理解するためには線形代数や微積分などの基本的な数学の知識も必要です。さらに上記の知識とスキルを使って自分で考えたアルゴリズムや統計モデリングの手法を実際に実装するにはプログラミングの技量も必要です。これらを総合的に学習し活用することによって始めてデータに内在する規則性を正しく把握し、その規則性から社会に役立つ知見を獲得することができます。開発したアルゴリズムが特許につながることもあります。データ解析の一連のプロセスを修得すると、様々な分野で活躍するチャンスが広がります。例えば病院で蓄積される医療データを扱えるようになると、どのような患者さんに対しどのような治療が効果的かを判断することができるようになり、病気や怪我で困っている患者さんの役に立つことができます。医師のように直接患者さんの治療はできませんが、データ解析を通して間接的に貢献できる。これもデータサイエンスに携わることの大きな魅力の1つです。

ゼミ・研究室の魅力

  • ⽂献を読み解く力が身につく
  • 学外の人と交流ができる
  • 論理的な思考力が鍛えられる

卒業論文のテーマ

  • 生存時間分析を用いた発作性心房細動のモニタリング期間の推定
  • AWSを用いたリコメンデーションデータの解析
  • 作家辻村深月の文体特徴の解析
  • 欠損値補完による心筋梗塞症のhANPの有効性の検討
  • Twitterデータを用いた感情分析
  • NBAデータを用いたバスケット選手の特徴分
  • 欧州五大リーグにおける優勝チームの要因分析
  • ダルビッシュ有投手の配球パターンの解析

教員のプロフィール

小森 理 准教授

Osamu Komori

2010年総合研究大学院大学複合科学研究科修了(博士 統計科学)。その後統計数理研究所、福井大学を経て、2018年4月から成蹊大学に勤務。日本統計学会、日本計量生物学会、応用統計学会に所属。日本計量生物学会誌編集委員、Japanese Journal of Statistics and Data Scienceの編集委員、応用統計学会の理事を担当。2016年には日本計量生物学会から奨励賞を授与される。

研究分野
生物統計、医療統計、機械学習、情報幾何学、データサイエンス
ページトップへ戻る