AIで複数の同時音声を分離、再現率は脅威の90％　深層学習で音声の分け方を学ぶ : 理系にゅーす

1: 2017/05/29(月) 20:44:06.12 ID:CAP_USER9

http://eetimes.jp/ee/articles/1705/29/news084.html

三菱電機は研究成果披露会で、同社独自のAI技術「ディープクラスタリング」を用いた音声分離技術を発表した。この技術では、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現できる。従来の技術では原音再現率が51％だったが、三菱電機の音声分離技術の場合90％以上となる。
[辻村祐揮，EE Times Japan]
答えではなく、解き方を学ぶ

　スマートフォンやカーナビなどの音声認識機能は、雑音や複数の人の声が混じると正しく機能しないことが多い。音を聞き分けて再現する技術自体は既に存在するが、精度の面でまだ十分とはいえない。マイク1本で取得した音声を分離し再現する技術の場合は特にだ。

　三菱電機が同社独自のAI技術「ディープクラスタリング」を用い、音声分離技術を開発したのにはこのような背景がある。三菱電機は2017年5月24日の研究成果発表会で、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現する様子を披露した。

https://youtu.be/KC_xJpF1R4E

続きはソースで

3: 2017/05/29(月) 20:47:35.79 ID:5BDwdqUj0

これで音声認識もわざわざマイク近くで喋んなくても、雑音除去して自然な声を聞き分けれるって事？
これって、かなり凄いんじゃない？

51: 2017/05/29(月) 22:01:07.68 ID:+lQbAHrn0

>>3
画像認識と音声認識はディープラーニングで劇的に進化するよ

でも、推論マシンはヘイズ理論入れてもまだまだだと思うんで、人の仕事が無くなるとかは大きな誇張

ロボットは進化してるから、力仕事は置き換わるが、そもそも人手不足の業界なので雇用は減らない

5: 2017/05/29(月) 20:50:23.73 ID:C1ZfLk1p0

声域分離でしょ
ナビは指向性マイクをハンドルに付けるだけでいいかも

6: 2017/05/29(月) 20:50:26.77 ID:dfKcQQVr0

聖徳太子かよ

23: 2017/05/29(月) 21:15:59.46 ID:K9q9bQNR0

>>6
確か先週のニュースで取り上げられていて見た時にそう思った。

7: 2017/05/29(月) 20:51:47.97 ID:fmCpJNKN0

事実上使い物にならない技術ｗ

8: 2017/05/29(月) 20:52:04.82 ID:6qHwbplr0

何年か前にアシモが実演してなかったか

9: 2017/05/29(月) 20:53:15.09 ID:UqvgWJIt0

光ケーブルの多重伝送みたいなもんじゃねえか

11: 2017/05/29(月) 20:55:34.50 ID:D1GA1g090

90%というのがほんとうに実用かどうか。
90％以上をカバーするという英単語集を覚えても10％わからないと
全然意味がとれかったのを思い出す

12: 2017/05/29(月) 20:55:41.89 ID:r7tPkX2X0

曲の歌だけ完全に拾えたりするのかな

13: 2017/05/29(月) 20:57:35.29 ID:inz+2R680

原音再現率が謎
再現できていなくても識別可能かも？

16: 2017/05/29(月) 20:59:08.80 ID:ykcVmsJB0

これものすごいな、Googleとかが協業しようと言ってきそう

18: 2017/05/29(月) 21:01:48.81 ID:+miUJfrg0

これ本当に実用性があるなら
世界中の会社で会議の録音に使われることになるな

20: 2017/05/29(月) 21:05:21.47 ID:ykcVmsJB0

音声認識技術で必須と言える機能だから
研究してる企業は多そうだけど、発表出来るほどの出来のところはまだないから
大幅にリードだな

21: 2017/05/29(月) 21:05:28.96 ID:W2iYL8wd0

合体ロボでの操作や会話に必要不可欠な技術

22: 2017/05/29(月) 21:10:27.50 ID:55Op8UqY0

居ないはずの人の声が

24: 2017/05/29(月) 21:16:28.52 ID:su1l+TSN0

このまま議事録まで作ってくれると大変ありがたい

28: 2017/05/29(月) 21:19:44.63 ID:MCvlgDLP0

>>24
議事録ってあんまり見なくない？

68: 2017/05/29(月) 23:23:51.06 ID:uMzTsUoK0

>>28
責任の押し付け合いをする社風の企業では議事録は必須。

70: 2017/05/29(月) 23:26:38.59 ID:MCvlgDLP0

>>68
そういう使い方するのか

26: 2017/05/29(月) 21:17:12.10 ID:K9q9bQNR0

国会のヤジの出所がわかったりしてｗ

27: 2017/05/29(月) 21:17:29.55 ID:R5X6Cv8O0

スパイ活動に最適だなあ。

32: 2017/05/29(月) 21:35:43.58 ID:fH5sDXO/0

独自で開発する能力がないから、概出している技術を発展しましたて言うオチ

34: 2017/05/29(月) 21:36:56.21 ID:qON/+OwJ0

意味にまで踏み込まないで声色だけで分離するんじゃないかと思う。
音声は有限次元の状態ベクトルで表現しやすいからディープラーニングとの相性は良さそう。

43: 2017/05/29(月) 21:41:27.67 ID:B1HpupCq0

聖徳太子だな。
だけど実用的にはどういう場面で使うんだ？

44: 2017/05/29(月) 21:43:26.32 ID:qON/+OwJ0

>>43
マイクが他人の声や騒音を拾ってしまったのを消すのに使うとか

61: 2017/05/29(月) 22:13:13.25 ID:3fPCP87l0

>>43
YouTubeの自動字幕起こし→翻訳とか

46: 2017/05/29(月) 21:53:16.11 ID:Jb2cxpGv0

これ凄いと思った
カクテルパーティ効果
これまでは独立成分分析とかでやってたが
2つの音声の連立方程式の解を解くのに
2つの音声データが必要だった

これが1つで済んだことは凄い

47: 2017/05/29(月) 21:55:42.80 ID:Jb2cxpGv0

何人まで分離できるか気になるな

フリーソフトでつくる音声認識システムパターン認識・機械学習の初歩から対話システムまで

posted with AZlink at 2017.6.2

荒木雅弘
森北出版
売り上げランキング: 18399

Amazon.co.jp で詳細を見る

タグ：: #AI; #人工知能; #音声; #分離; #再現; #認識; #機能; #精度; #成分; #システム

理系にゅーす

理系に関する情報を発信！理系とあるものの文系理系関係なく気になったものを紹介します！

AIで複数の同時音声を分離、再現率は脅威の90％　深層学習で音声の分け方を学ぶ

コメントする

トラックバック

「通信・IT」カテゴリの最新記事

「技術」カテゴリの最新記事

コメントする

トラックバック