研究活動紹介
1994年慶應義塾大学理工学部物理学科卒業。1996年同大学大学院修士課程修了。同年、NHK入局。山口放送局を経て、1998年より放送技術研究所に勤務。2009年米カーネギーメロン大学客員研究員。2010慶應義塾大学大学院理工学研究科開放環境科学専攻後期博士課程単位取得退学。2015年成蹊大学理工学部准教授、2017年より現職。音声合成、音声認識の研究に従事。2002年電子情報通信学会論文賞、2012年前島密賞。2013年文部科学大臣表彰科学技術賞、2017年電気通信普及財団賞(テレコムシステム技術賞奨励賞)各受賞。博士(工学)。
私は、これまで文字を音声に変換する技術である音声合成の研究を行ってきました。音声合成は、バーチャルなキャラクターやロボットがしゃべる時など、人と機械がコミュニケーションをとる際には必須となる技術です。私がこれまでに研究・開発した技術の一つに株式市況音声合成システムというものがあり、以下でこのシステムについて簡単にご紹介したいと思います。
NHKラジオ第2放送の番組「株式市況」では、およそ800銘柄の株価・前日比を、約45分間にわたって読み上げます。限られた時間内に早口で情報を伝えるのは、ベテランのアナウンサーにとっても大変でした。このため、自動で株式市況の番組を放送できるシステムの開発を行い、2010年3月から開発したシステムを用いて、平日毎日放送が行われています。
開発したシステムでは、音のバランスが考慮された約4000個の数値をアナウンサーが読み上げた録音音声から、1億未満のすべての数値を音声合成することが可能です。システムの内部では、収録した音声の中から、音のつながりが最も滑らかになる組み合わせを選択し接続することで合成音を作成します。この手法により、ほぼ肉声と変わりがない自然性を持つ合成音を実現することができるようになりました。
開発した技術について、さらに研究を進めていく予定です。特に、NHKラジオ第2放送の番組「気象通報」については、同じような考えでこれまで研究・開発を進めて、肉声とほぼ変わらない自然性を持つ合成音が実現できたので、今後の実用化が期待されます。また、音声合成に限らず、音声を文字に変換する技術である音声認識も研究の対象として含めることにより、音声によるスムーズな情報授受の実現を目指していきたいと考えています。