hirax.net::Keywords::「声紋解析」のブログ



1999-01-07[n年前へ]

振動・声紋解析用のソフトをつくる 

PCオシロソフトを高機能にしたい

 前に作った2Chオシロ&FFTアナライザーに時間vs周波数グラフの表示機能を付けたい。そうすれば、もしも音声解析に利用するならば、声紋分析もできる。また、振動解析ならば、周波数変化を簡単に調べることができる。こういったものが簡単に作れるのはLabViewの素晴らしい所だ。

 このソフトを動かすと、コンピューターのファンやハードディスクの回転数はとても鋭い周波数ピークを持っていることがよくわかる。また、マイクに向かってしゃべれば、声紋分析も可能である。ウソ発見器などにも応用してみたい。

 下がアプリケーションを動かした様子である。左上が生波形、左下が周波数vs強度、右上が1Ch目の時間vs周波数分布、右下が2Ch目の時間vs周波数分布である。

作ったアプリケーションの画面 (適当にしゃべったところ)

 測定用の準備は整ったので、このアプリケーションを使って色々な音声解析や振動解析などをしてみたい。ところで、このアプリケーションを作成した所で、ほとんど同じようなソフトの広告を見かけた。

http://www.mcor.co.jp/goods/fft/

 上に載っているソフトと同じようなことは今回のソフトを使えばできると思う。また、http://www.mcor.co.jp/goods/fft/にあるソフトの便利そうなところは参考にしたい。

 ここに今回作成したアプリケーションを置いておく。
ocilo2.lzh 1,266KB (打ち止めです。あしからず。)
 LabViewのアプリケーションライセンス上、ダウンロード数が40本を近くなったところで削除する。

2000-03-05[n年前へ]

私の日本語練習帳 

アメンボ赤いなアイウエオ

 もうすぐ、4月である。4月といえば、新学期だ。といっても、私は別に学生ではないので、新学期といっても特に何があるわけではない。別に新しい授業が始まるわけではないのである。しかし、私は何故かこの時期になると「英会話」を勉強したくなるのである。

 去年の初めにも英語学習熱に襲われ、NHKのラジオ講座を通勤途中やることにしてみた。しかし、いつものように二ヶ月だけで挫折してしまった。そういうわけで、NHKラジオ「英会話」講座の毎年4月分のテキストが私の家には沢山ある。
 それだけでなくて、この時期には「一週間でわかる英会話(仮名)」というような本も買い込んでしまう。しかし、これもまた買うだけで終わってしまっていたのだ。どうも、私の興味が散漫であることも理由の一つだろう。湯川秀樹は

 「今日はあれをやり、明日はこれ、というように、あまり気が散ると、結局どれもものにならないですね。」
という非常に的確なことを言っているらしいが、まさにその通りである。話題が飛びまくりの「できるかな?」には実に痛い指摘である。しかし、糸川英夫は
 「自分にできること」よりも「世の中が求めていること」に挑戦し続けた方が人生も楽しい。
言っているらしいし、気にしないでおく(進歩無し)。

 私はそういう生活が10年近く続いている。そんなわけで、英語のテキストは増えたが、英語能力は減る一方だ。いやまてよ、ということは

  • 一人の人が持つNHKラジオ「英会話」講座の4月分テキストの冊数
  • 一人の人が持つ英会話能力
は反比例するのかもしれない。その仮説を適用するならば、
  • 今年のNHKラジオ「英会話」講座の4月分テキストを買わなければ、私の英語能力はアップする
という推論が可能である。逆に言えば、今年もまたNHKラジオ「英会話」講座の4月分テキストを買うと、ますます英語能力が低下してしまう、ということだ。私の英語能力が低下したのは、英語のテキストを買いすぎたせいで、もしかしたら、英語のテキストを全部捨てれば英語能力がアップするかもしれない。

 いや、こんなワケのわからない仮説を論じている場合ではない。これは、非常にマズイ。今年こそ、三日坊主は止めなければならない。新しいミレニアムが訪れたことでもあるし、バージョンアップした私(仮に私2000とでも名付けておこう)になるためにも、今回こそ英会話の勉強をしてみたいと思う。

 そこで、発売されてすぐ買ったは良いが、そのまま本棚で眠っていた

  • BLUE BACKS 英語スピーキング科学的上達法 山田・足立・ATR人間情報通信研究所
で遊んでみることにした。この本は
  • BLUE BACKS 英語リスニング科学的上達法 山田・足立・ATR人間情報通信研究所
の続編である。もちろん、私は両者とも買っただけで「積ん読(つんどく)」であった。いや、ホントは読んだのだけれど…

 それでは、今年の勉強を始めてみることにしたい。この本の主な内容は

  • 英語における発音を科学的に分析(主にフォルマント、スペクトログラム)する。
という感じである。

 これまで、「できるかな?」では

といった感じで音のスペクトログラムはよく登場している。なので、きっと感覚的に判りやすいはずだ(少なくとも理屈としては…)。

 しかし、いきなり私に英語はキツイ。まずは日本語の練習から始めることにした。日本語の母音の発音を練習するのである。そうすれば、自分自身の日本語を再確認できるし、この本の信頼性もチェックできる。「フォルマントで音声を判断する」というのがどの程度使えるものであるかを、私の日本語でチェックすることができるのである。何しろ、変な発音かもしれないが、一応私は日本語のネイティブであるからだ。

 それでは、「英語スピーキング科学的上達法」に付属のソフトで私のフォルマントを調べてみる。これが私の「あいうえお」のスペクトログラムとフォルマントである。
 

私の「あいうえお」のスペクトログラムとフォルマント

縦軸=周波数, 横軸=時間

 ここで、色丸で示してあるのが

  • 赤 = 第1フォルマント ( F1 )
  • 青 = 第2フォルマント ( F2 )
  • 緑 = 第3フォルマント ( F3 )
である。簡単に言えば、周波数のピークを低い方から番号付けしたものである。

 それでは、私の「あいうえお」をF1-F2空間にマッピングしたものを次に示す。これも、「英語スピーキング科学的上達法」に付属のソフトによるモノであり、標準的な男性の「あいうえお」の分布が示されている。そして、赤丸で示してあるのが私の「あいうえお」である。
 そして、F1-F2空間における英語の母音分布の上に私の「あいうえお」を重ねたものも示す。
 

F1-F2空間における私の「あいうえお」
横軸 = F1(Hz)、縦軸 = F2(Hz)





私の「あいうえお」を
英語の母音に重ねてみた図

 こうフォルマント分析をしてみると、私の「い」「う」「え」は標準的な分布の中に入っていることがわかる。しかし、「あ」「お」はそうではない。
むしろ、私は発音は英語の母音でいうところの

  • 「あ」 = 
  • 「お」 = 
という感じである。まぁ、
  • 私の発音の精度の問題 = 私の発音がヘン?
  • 測定・解析の精度の問題
かはさておき、精度はこんなものなのだろう。結構、ちゃんと判断できるものだなぁ、というのがこの解析に対して私の受けた印象である。こういう音声解析というのも実に面白そうな分野である。

 さて、最初のうちはこの本付属のソフトを使って遊んでいくことになると思う。しかし、いつか自作のソフトウェアを作成し、F1-F2-F3空間での「あいうえお」の可視化でもしてみたい。言葉の可視化、さらには言霊の可視化をしていく予定である。(あれっ、そう言えば英会話の勉強はどこへ…)
 

今日はあれをやり、明日はこれ、というように、あまり気が散ると、結局どれもものにならないですね。
By 湯川秀樹



■Powered by yagm.net