東北大学 大学院 理学研究科・理学部|アウトリーチ支援室

ホーム > お知らせ > レポート > 【広報サポーターレポート】10月20日 (日) ぶらりがく『声を可視化して分析しよう』
2019年11月 5日レポート

【広報サポーターレポート】10月20日 (日) ぶらりがく『声を可視化して分析しよう』

nakajima.jpg広報サポーターレポート
今回は10月20日(日)開催「ぶらりがく」の様子を中島 優斗(化学科3年)がお伝えします!


 コンピュータに話しかけることで、必要な情報を検索できたり、パソコンに話しかけることで話しかけた内容を正確に文字化したり、話しかけることのできるAIが登場したりと、近年コンピュータの音声認識の精度は急速に高まっています。


 コンピュータは人の話した内容をどのように読み取っているのでしょう?今回のぶらりがくは、サイクロトロンRIセンターの田中香津生先生による、声の波形の分析のワークショップです。今回のワークショップには幅広い年齢層の方に参加していただき、コンピュータを用いた声の波形の分析を体験していただきました。


 コンピュータから発せられる音や、人の発する声などの私たちが普段耳にする音は空気の密度の変化による振動であり、振動の振幅が音の大きさ、周波数は音の高さを表しています。


20190518_1.jpg

 音の振動の様子を観察しています。


 声の振動の波形が人によって異なるため、人の発する声は一人一人違ったものとして認識されます。また、「あ」の声と「い」の声とで振動の波形が異なるため、「あ」の声と「い」の声をそれぞれ異なる声として私たちは認識しています。声の個人差や、内容による声の振動の波形の違いをコンピュータで確認することで実際に調べました。


20190518_2.jpg

 コンピュータに向かって声を出して、声の波形を調べています。


 声の波形が個人や話す内容によって異なるのは、声帯で生じた基本振動が一人一人異なる口腔や鼻腔で変えられ、また、異なる母音を話すときの、異なる口の形が振動の様子を変えるためです。


20190518_3.jpg


 声の波形は一人一人異なったものであるのに、声に出した内容はどのように決定されているのでしょう?この問題を考えるために、声の波形の見方を、時間を軸に取ったグラフから、振動の周波数を軸に取ったグラフに変え、声のスペクトルとして声の波形を観察しました。


 声の振動には話した内容により異なる周波数の振動が含まれています。例えば、「あ」の音には広い範囲の周波数の振動が含まれていますが、「い」の音は主に高い周波数の振動から成り立っています。このように、話した内容により、音を構成する周波数にはそれぞれ特徴が確認されます。


 この声の振動を構成する周波数は発せられた声の内容により異なる、という性質を基に、周波数のスペクトルから話した2文字の母音の内容を当てる課題に取り組みました。「あ」「い」「う」「え」「お」のそれぞれの音を構成する周波数をコンピュータで調べ、得られたそれぞれの音の周波数のスペクトルから、課題のスペクトルで話されている内容を当てました。


20190518_3.jpg

 周波数ごとのスペクトルを調べ、話した内容による違いを見ています。


 人や音声を認識するコンピュータが話している内容を認識できるのは、この話されている内容による振動数の特徴を読み取っているためです。また、声をスペクトルに分解することで、声に出して話されている内容や、声を出している人の特徴、その人の居る環境を分析でき、この手法は犯罪捜査においても用いられています。


 観測した波形を周波数ごとのスペクトルに分解する、という手法は、様々な放射線が混ざったものの観測において、どの核種がどのくらい放射線を出しているかの決定にも用いることができ、ここから、田中先生の研究に繋げることができる、というお話もありました。


 今回のぶらりがくでは、声の振動の波形を時間に対するグラフで見るだけでなく、それを周波数ごと見てみることで話している内容の分析もできる、というように、ものの見方を変えることで、新たなものが見つかる、ということを体験していただきました。

カテゴリー

最新の記事

アーカイヴ

ページの先頭へ