Home 理工学部 │ コンピュータ科学専攻
言語情報研究室

- 対象学年
- 3・4年次
- 担当教員名
- 酒井 浩之
- Hiroyuki Sakai
- 学びのキーワード
-
- 自然言語処理
- テキストマイニング
- 情報検索
- 情報発信
- > Webサイト
研究の内容
本研究室では、自然言語処理技術を活用し、大量のテキストデータから重要な情報を抽出する研究を行っています。本研究室で対象としているテキストデータは、決算短信や有価証券報告書といった金融テキスト、企業、大学、自治体などのWEBサイト、経済新聞記事、特許などです。そのようなテキストデータから、自然言語処理と機械学習を使って重要な情報を抽出することを主な研究テーマとしています。さらに抽出した情報を用いて、株式投資支援や就職活動支援のための企業検索、大学の研究室検索などのシステムを開発しています。研究の成果として、例えば、決算短信から機械学習を用いて抽出した業績要因を対象とした企業検索システムを研究室WEBサイトにて公開しています。

研究の進め方
本研究室では、研究室の研究活動を表すような大きなプロジェクトが7つ程度、設定されています。例えば「就職活動支援技術の開発」「大学検索システムの開発」「株式投資判断支援技術の開発」「特許マイニング」「地方活性化のための情報抽出」などです。さらに、各プロジェクトにつき、多くの研究テーマで細分されています。研究テーマの決め方は、まずは自分の興味のあるプロジェクトを選択し、さらに、そのプロジェクトに属する研究テーマを提示しますので、その中から選択することになります。また、自然言語処理の範囲内で研究テーマを自分で考えてもよいです。研究の進め方としては、進捗報告会にて進捗状況を報告してもらい、進捗に基づいて指示をだします。
社会との関わり
本研究室では、特に決算短信や有価証券報告書といった金融テキストを対象としたテキストマイニングを特色としています。このような研究は、金融系の企業において注目されています。ただ、現在、テキスト処理はどの企業でも注目され、数年前では自然言語処理とは全く関係のなかった企業でも、自然言語処理の技術を業務に取り入れ、業務の効率化に取り組んでいます。そのような時に本研究室で学んだ知識や技術が役に立つと思います。
ゼミ・研究室の魅力
- ⽂献を読み解く力が身につく
- プレゼンテーション⼒が⾝につく
- 論理的な思考力が鍛えられる
卒業論文のテーマ
- 債券市場における金融極性辞書の自動構築
- 株価データと決算短信を用いた日経平均市況概況記事の自動生成
- 機械学習を用いた統合報告書のESG関連ページの推定
- 統合報告書からのESG関連情報の自動抽出
- 製品特徴に基づく製品発表プレスリリースの関連特許自動判定
- 業績要因・結果を用いた特許の価値判定のための関連性推定
教員のプロフィール

酒井 浩之
Hiroyuki Sakai
平成24年4月 成蹊大学 理工学部 情報科学科 講師
平成26年4月 成蹊大学 理工学部 情報科学科 准教授
令和3年4月 成蹊大学 理工学部 情報科学科 教授
- 研究分野
- 自然言語処理、テキストマイニング、人工知能