1: 2017/05/29(月) 20:44:06.12 ID:CAP_USER9
http://eetimes.jp/ee/articles/1705/29/news084.html

三菱電機は研究成果披露会で、同社独自のAI技術「ディープクラスタリング」を用いた音声分離技術を発表した。この技術では、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現できる。従来の技術では原音再現率が51%だったが、三菱電機の音声分離技術の場合90%以上となる。
[辻村祐揮,EE Times Japan]
答えではなく、解き方を学ぶ

 スマートフォンやカーナビなどの音声認識機能は、雑音や複数の人の声が混じると正しく機能しないことが多い。音を聞き分けて再現する技術自体は既に存在するが、精度の面でまだ十分とはいえない。マイク1本で取得した音声を分離し再現する技術の場合は特にだ。

 三菱電機が同社独自のAI技術「ディープクラスタリング」を用い、音声分離技術を開発したのにはこのような背景がある。三菱電機は2017年5月24日の研究成果発表会で、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現する様子を披露した。

https://youtu.be/KC_xJpF1R4E


続きはソースで
ダウンロード (3)


引用元: 【AI】AIで複数の同時音声を分離、再現率は脅威の90% 深層学習で音声の分け方を学ぶ: [無断転載禁止]©2ch.net

スポンサーリンク
3: 2017/05/29(月) 20:47:35.79 ID:5BDwdqUj0
これで音声認識もわざわざマイク近くで喋んなくても、雑音除去して自然な声を聞き分けれるって事?
これって、かなり凄いんじゃない?

51: 2017/05/29(月) 22:01:07.68 ID:+lQbAHrn0
>>3
画像認識と音声認識はディープラーニングで劇的に進化するよ

でも、推論マシンはヘイズ理論入れてもまだまだだと思うんで、人の仕事が無くなるとかは大きな誇張

ロボットは進化してるから、力仕事は置き換わるが、そもそも人手不足の業界なので雇用は減らない

5: 2017/05/29(月) 20:50:23.73 ID:C1ZfLk1p0
声域分離でしょ
ナビは指向性マイクをハンドルに付けるだけでいいかも

6: 2017/05/29(月) 20:50:26.77 ID:dfKcQQVr0
聖徳太子かよ

23: 2017/05/29(月) 21:15:59.46 ID:K9q9bQNR0
>>6
確か先週のニュースで取り上げられていて見た時にそう思った。

7: 2017/05/29(月) 20:51:47.97 ID:fmCpJNKN0
事実上使い物にならない技術w

8: 2017/05/29(月) 20:52:04.82 ID:6qHwbplr0
何年か前にアシモが実演してなかったか

9: 2017/05/29(月) 20:53:15.09 ID:UqvgWJIt0
光ケーブルの多重伝送みたいなもんじゃねえか

11: 2017/05/29(月) 20:55:34.50 ID:D1GA1g090
90%というのがほんとうに実用かどうか。
90%以上をカバーするという英単語集を覚えても10%わからないと
全然意味がとれかったのを思い出す

12: 2017/05/29(月) 20:55:41.89 ID:r7tPkX2X0
曲の歌だけ完全に拾えたりするのかな

13: 2017/05/29(月) 20:57:35.29 ID:inz+2R680
原音再現率が謎
再現できていなくても識別可能かも?

16: 2017/05/29(月) 20:59:08.80 ID:ykcVmsJB0
これものすごいな、Googleとかが協業しようと言ってきそう

18: 2017/05/29(月) 21:01:48.81 ID:+miUJfrg0
これ本当に実用性があるなら
世界中の会社で会議の録音に使われることになるな

20: 2017/05/29(月) 21:05:21.47 ID:ykcVmsJB0
音声認識技術で必須と言える機能だから
研究してる企業は多そうだけど、発表出来るほどの出来のところはまだないから
大幅にリードだな

21: 2017/05/29(月) 21:05:28.96 ID:W2iYL8wd0
合体ロボでの操作や会話に必要不可欠な技術

22: 2017/05/29(月) 21:10:27.50 ID:55Op8UqY0
居ないはずの人の声が

24: 2017/05/29(月) 21:16:28.52 ID:su1l+TSN0
このまま議事録まで作ってくれると大変ありがたい

28: 2017/05/29(月) 21:19:44.63 ID:MCvlgDLP0
>>24
議事録ってあんまり見なくない?

68: 2017/05/29(月) 23:23:51.06 ID:uMzTsUoK0
>>28
責任の押し付け合いをする社風の企業では議事録は必須。

70: 2017/05/29(月) 23:26:38.59 ID:MCvlgDLP0
>>68
そういう使い方するのか

26: 2017/05/29(月) 21:17:12.10 ID:K9q9bQNR0
国会のヤジの出所がわかったりしてw

27: 2017/05/29(月) 21:17:29.55 ID:R5X6Cv8O0
スパイ活動に最適だなあ。

32: 2017/05/29(月) 21:35:43.58 ID:fH5sDXO/0
独自で開発する能力がないから、概出している技術を発展しましたて言うオチ

34: 2017/05/29(月) 21:36:56.21 ID:qON/+OwJ0
意味にまで踏み込まないで声色だけで分離するんじゃないかと思う。
音声は有限次元の状態ベクトルで表現しやすいからディープラーニングとの相性は良さそう。

43: 2017/05/29(月) 21:41:27.67 ID:B1HpupCq0
聖徳太子だな。
だけど実用的にはどういう場面で使うんだ?

44: 2017/05/29(月) 21:43:26.32 ID:qON/+OwJ0
>>43
マイクが他人の声や騒音を拾ってしまったのを消すのに使うとか

61: 2017/05/29(月) 22:13:13.25 ID:3fPCP87l0
>>43
YouTubeの自動字幕起こし→翻訳とか

46: 2017/05/29(月) 21:53:16.11 ID:Jb2cxpGv0
これ凄いと思った
カクテルパーティ効果
これまでは独立成分分析とかでやってたが
2つの音声の連立方程式の解を解くのに
2つの音声データが必要だった

これが1つで済んだことは凄い

47: 2017/05/29(月) 21:55:42.80 ID:Jb2cxpGv0
何人まで分離できるか気になるな