(記事)NTT 2人の声を同時に聞き分け 会議録の自動編集に活用

 ★阿修羅♪

[ フォローアップ ] [ フォローアップを投稿 ] [ ★阿修羅♪ Ψ空耳の丘Ψ14 ]

投稿者 踊る藁人形 日時 2001 年 7 月 27 日 02:50:00:

回答先: (転載)『携帯電話のすべての会話が覗かれるための技術的裏付け』+α 投稿者 踊る藁人形 日時 2001 年 7 月 25 日 00:47:04:


 NTTコミュニケーション科学基礎研究所は、同時に話す二人の声をコンピューターで聞き分ける技術を開発した。重なった二人の声を話し手ごと分離し、別々にスピーカーから出力する。今後は聖徳太子の耳のように複数人の声が聞き分けられるよう改良を進め、会議の議事録を自動編集するシステムなどへの応用を目指す。


 NTT研の開発した技術
「アヒャヒャ+ゴルァ」   注)新聞記事のとは表現が若干異なります。
Λ_Λ → マイク1 __  / ̄ ̄ ̄ ̄ ̄\
( ゚∀゚) -----------E⊃                 |○|<「アヒャヒャ」| 
「アヒャヒャ」 + │ ∞   /===ヘ   / ̄ ̄ \______/
     \   + ┷ ∞   /====ヘ|___| | /  スピーカー1
      \ + ∞   ‖〃 ‖||==| |/
+\       ∞ ====/_| o| |
  +  \     / ̄ ̄/ /L  |/\
∧_∧ + \ マイク2 ∞   ̄ ̄ ̄ ̄  ̄ ̄  \ スピーカー2
(`Д´)+ + + + + +E⊃ ∞    パソコン      \__ / ̄ ̄ ̄\
「ゴルァ」 →    │ ∞               |○|<「ゴルァ」|
           ┷                  ̄ ̄ \___/
「ゴルァ+アヒャヒャ」 

 開発した技術は、部屋の中で話し手がいる位置や雑音の状況などに関係なく使えるのが特徴。二つのマイクがそれぞれとらえた二人の声の重なった音声をコンピューターで処理し、一人ずつの声の分けてスピーカーから再生する。
 二つのマイクからとらえた信号には、二人の位置とマイクの位置が違うために、音声がシステムに到達する時間や音の響き具合(残響)に微妙なずれがある。脳波の分析に使われる独立成分分析という手法を応用、ある変数をかけて二人の話者の信号を比較し、一人の声を大きく、もう一人の声が小さくなるように処理する。
 この操作を2回繰り返して、二人分の声をそれぞれ取り出す。
 現在の技術は、音声を正確に分けるために話者の位置を固定したり、ヘッドセットマイクを使ったりして話者の声をしっかり取り込む必要があった。雑音が入るとうまく分離できないため、響かないような特殊な部屋でないとうまくいかなかった。新技術では、こうした制限が無く、通常の部屋でも使えるという。
 研究グループは、よりはっきり聞き分けるよう精度を上げ、聞き分けられる人数を増やして実用化を目指す。将来はロボットの耳をして組み込むことも考えている。
[日経産業7/17] 


★コメント
これは、諜報メールに紹介されたAI音声認識システム「オアシス」の水準とは、どのくらいの距離があるのかな?
「脳波」っても、例えば周波数成分を求めておいて相関性の高い集合を推定して分離するんだろうかねえ。
カルト野郎はこのネタ使ってインチキカルト投稿するな



フォローアップ:



  拍手はせず、拍手一覧を見る


★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
投稿コメント全ログ  コメント即時配信  スレ建て依頼  削除コメント確認方法
★阿修羅♪ http://www.asyura2.com/  since 1995
 題名には必ず「阿修羅さんへ」と記述してください。
掲示板,MLを含むこのサイトすべての
一切の引用、転載、リンクを許可いたします。確認メールは不要です。
引用元リンクを表示してください。