研究活動紹介

RESEARCH ACTIVITIES
人にわかりやすい情報提示の実現を目指して

はじめに

私は、これまで文字を音声に変換する技術である音声合成の研究を行ってきました。音声合成は、バーチャルなキャラクターやロボットがしゃべる時など、人と機械がコミュニケーションをとる際には必須となる技術です。私がこれまでに研究・開発した技術の一つに株式市況音声合成システムというものがあり、以下でこのシステムについて簡単にご紹介したいと思います。

音声情報研究室
世木寛之准教授

株式市況音声合成システム

NHKラジオ第2放送の番組「株式市況」では、およそ800銘柄の株価・前日比を、約45分間にわたって読み上げます。限られた時間内に早口で情報を伝えるのは、ベテランのアナウンサーにとっても大変でした。このため、自動で株式市況の番組を放送できるシステムの開発を行い、2010年3月から開発したシステムを用いて、平日毎日放送が行われています。
開発したシステムでは、音のバランスが考慮された約4000個の数値をアナウンサーが読み上げた録音音声から、1億未満のすべての数値を音声合成することが可能です。システムの内部では、収録した音声の中から、音のつながりが最も滑らかになる組み合わせを選択し接続することで合成音を作成します。この手法により、ほぼ肉声と変わりがない自然性を持つ合成音を実現することができるようになりました。

今後の展開

開発した技術について、さらに研究を進めていく予定です。特に、NHKラジオ第2放送の番組「気象通報」については、同じような考えでこれまで研究・開発を進めて、肉声とほぼ変わらない自然性を持つ合成音が実現できたので、今後の実用化が期待されます。また、音声合成に限らず、音声を文字に変換する技術である音声認識も研究の対象として含めることにより、音声によるスムーズな情報授受の実現を目指していきたいと考えています。