理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/06/09(日) 05:15:58.79 ID:CAP_USER
赤ちゃんの泣き声の意味をAIで聞き分けることが可能に
https://gigazine.net/amp/20190607-ai-understand-baby-different-cries
2019年06月07日 14時00分00秒
GigaZiNE

 赤ちゃんの泣き声は親を心配にさせたり、イライラさせたりするものです。
 そんな赤ちゃんの泣き声を人工知能(AI)を用いて聞き分けることで、「正常な泣き声」と「異常な泣き声」を区別するという研究が進められています。

 Infant cry language analysis and recognition: an experimental approach - IEEE Journals & Magazine
 https://ieeexplore.ieee.org/document/8657383

 Artificial intelligence that can understand meaning of a baby’s different cries- Technology News, Firstpost
 https://www.firstpost.com/tech/science/artificial-intelligence-to-understand-meaning-behind-the-different-babies-cries-6766841.html

 赤ちゃんはお腹が減ったり、病気で体調が悪くなったりすると泣きますが、それだけでなく親の気を引くために泣くこともあります。
 熟練の親や専門家であれば乳児の泣き声の意味をある程度理解することができるため、泣き声の意味を正確に認識することは可能であると考えられてきました。

 そこで、さまざまな意味合いを持つ幼児の泣き声の「周波数的領域における音声特徴」を分析し、「乳児が泣いている理由」を認識しようとしたのが、
 ノーザン・イリノイ・ユニバーシティの電気工学科で准教授を務めるLichuan Liu氏が率いる研究チーム。

 研究チームは線形予測符号を用いて乳児の泣き声から線形予測ケプストラム係数(LPCC)、バーク周波数ケプストラム係数(BFCC)、メル周波数ケプストラム係数(MFCC)といった形で音の特徴を抽出。

続きはソースで

ダウンロード


引用元: 【情報処理工学/AI】赤ちゃんの泣き声の意味をAIで聞き分けることが可能に[06/07]

【情報処理工学/AI】赤ちゃんの泣き声の意味をAIで聞き分けることが可能にの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/03/28(木) 06:11:08.39 ID:CAP_USER
■名探偵コナン』のアノ発明品が現実に

もはや国民的アニメと呼んでも良いだろう『名探偵コナン』。その中でお馴染みなのが、主人公・江戸川コナン(実は高校2年生の工藤新一が、悪の組織によって小学1年生に変えられてしまった姿)が私立探偵・毛利小五郎の体を借りて事件の真相を暴くシーンだ。

コナンは彼を睡眠薬で眠らせると、胸に付けた「蝶ネクタイ型変声機」を使って、自分の声を毛利小五郎そっくりに変換する。そして自らつきとめた事実を語って、問題を解決するのである――あたかも毛利小五郎が事件の謎を解いたかのようにして。

もちろん名探偵コナンはフィクション作品だが、多くのフィクション作品と同様に、劇中に登場するテクノロジーに現実のテクノロジーが追い付こうとしている。そう、この蝶ネクタイ型変声機さながらの「声の変換」を実現する技術が登場しているのだ。

まずはこちらのデモ映像をご覧いただこう。

(中略)

自分や誰かの声を任意に変化させることを「音声モーフィング」と呼び、いまAI技術をこの分野に応用しようという取り組みが盛んになっている。

そしてModulateがこのサービスを実現するのに活用したのが、「GAN(Generative Adversarial Networks、競争式生成ネットワーク)」と呼ばれる最新のAI技術だ。

■悪用防止の対策はあるものの…

GANについては、以前フェイクニュースに関する記事でも取り上げたことがある。簡単に説明すると、目標とするコンテンツを自動生成するAIと、そのコンテンツが本物かどうか見破るAIを用意し、その間でコンテンツ生成と真偽鑑定の「競争」を何千何万回と繰り返させることで、より自然で本物に近いコンテンツを生成できるようにするという手法である。

GANはいま、映像コンテンツ生成の分野で大きく注目されており、その威力を見せつけるものとして、同じくオバマ前大統領をサンプルとした(なぜか彼はデモの素材として人気らしい)有名なフェイク動画がある。

■動画
You Won’t Believe What Obama Says In This Video! 😉 https://youtu.be/cQ54GDm1eL0



この中で偽のオバマ氏は、「キルモンガー(映画『ブラックパンサー』に登場する悪役)は正しい」「トランプ大統領は大バカ者」など、本物がまったく言いそうにないセリフを口にしている。

そのため彼をよく知る人であれば、「何かおかしい」というフェイクの可能性を疑うことだろう。しかし彼の性格や表現のスタイルについてよく知らないという場合は、これがフェイクかどうか見破るのは至難の業に違いない。

そうした高品質のフェイク映像をつくり出せるAI技術を活用しているのが、Modulateのサービスというわけだ。となれば悪用が心配されるところだが、当然ながら同社もそのような使い道は推奨しておらず、たとえばオンラインゲームなどで使用するアバターに好きな声を喋らせるといった活用法を想定しているそうである。

最近は他のユーザーとマイクを通じてコミュニケーションできるオンラインゲームも増えているが、いくらアバターを可愛らしい女性にしても、野太い声では自分が中年男性だとばれてしまう(もちろんその逆のパターンもあるだろう)。そこでアバターを自分好みに着飾るのと同様に、声も好きなようにカスタマイズできれば、というわけだ。

■動画
Modulate: Unlock Your Voice https://youtu.be/lJBJOnryOLU



https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg
 
■オレオレ詐欺がさらに横行? 

人間がいかに音声によるコミュニケーションに騙されやすいか、振り込め詐欺、つまり「オレオレ詐欺」の被害が一向に無くならない日本に住む私たちには、痛いほどわかっているだろう。そんな状況でModulateのような音声モーフィングサービスが普及すれば、さらに詐欺行為が横行してしまう不安はないのだろうか。

実際に、気になる研究結果が出ている。アラバマ大学バーミンガム校コンピューターサイエンス学部の研究によると、人間の脳は、よく似た人間の音声の聞き比べができない可能性があるそうだ。

この研究を指揮した、主任研究者のNitesh Saxena博士は、同校のニュースリリースにおいて「人間は音声モーフィングを使用した攻撃に対し、根本的に脆弱な存在である可能性がある」と指摘している。

この研究では、オリジナルの声と変換によってつくられた声を被験者に聞かせ、その際に脳がどのような反応を示すかを、機能的近赤外分光法(fNIRS)という手法を使って観測した。

すると違う人の音声を聞かせた際には、脳の動きに違いが見られたものの、オリジナルの音声と、変換によってそれに似せた音声を聞かせた際には、脳内で同じ処理が行われていたそうである。つまりあくまで音声だけをインプットとした場合、人間の脳はオリジナルの声と、変換によってつくられた声に対して、脳のレベルで聞き分けができていないわけだ。

続きはソースで

https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg

https://gendai.ismedia.jp/articles/-/63693
images


引用元: 【AI】まるで『名探偵コナン』…遂に誕生した万能「変声機」の凄さと怖さ[03/26]

まるで『名探偵コナン』…遂に誕生した万能「変声機」の凄さと怖さの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/01/12(土) 03:32:49.65 ID:CAP_USER
【1月11日 AFP】
鳥類の雄では、鮮やかな色の羽や工夫を凝らした歌声を持つものが多いが、実際に雌が高く評価しているのは雄の「知力」かもしれないとする研究結果が10日、発表された。

 米科学誌サイエンス(Science)に論文が掲載された今回の研究は、進化論を提唱した英国の自然科学者チャールズ・ダーウィン(Charles Darwin)の従来説の一つと整合する。この説では、繁殖相手(配偶者)の選択が知力の進化に寄与する可能性があると考えられている。

 中国科学院(Chinese Academy of Sciences)とオランダ・ライデン大学(Leiden University)の共同研究チームが執筆した論文によると、「今回の研究は、認知能力(の駆使)を目の当たりにすると、配偶者選択にも影響が生じるということを実証している」という。

 求婚する雄の利口さは、体つきや歌声よりも重要度が勝るとする説を検証するために、研究チームはオーストラリアに生息するオウム目の小鳥、セキセイインコ34羽を用いた実験を行った。

 実験ではまず、外見が似ている雄2羽を、雌1羽と鳥かごの中で対面させた。この鳥かごは、雌が雄に1羽ずつしか接触できない仕組みになっている。今回と同様の設定で行われた過去研究では、外見がやや良い雄やより魅力的な歌声を持つ雄を雌が好む傾向があることが示されていた。

 雌がどちらの雄を好んでいるかは、雌が雄と接触するのに費やす時間の長さで判別した。

 その後、雌に好まれなかった方の雄を別の場所に移し、そこで餌となる種子がたくさん入った容器のふたを開ける特別な訓練を受けさせた。一方、雌と好まれている方の雄にはその訓練を施さず、自由に種を取り出して食べることのできるふたのない容器を与えた。

 次に、ふたをした容器が入れてある鳥かごに雌を移動させ、訓練を受けた雄が餌箱のふたを器用に開ける様子を観察させた。

続きはソースで

(c)AFP

http://afpbb.ismcdn.jp/mwimgs/1/c/810x540/img_1c23d1abc8c53be4e184e7b3cc7ee13388396.jpg

http://www.afpbb.com/articles/-/3205985
images (1)


引用元: 【動物】鳥の雌、パートナー選びの基準は「頭の良さ」か 研究

鳥の雌、パートナー選びの基準は「頭の良さ」か 研究の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/12/11(火) 14:17:22.19 ID:CAP_USER
■ケンカする夫婦は子育ても失敗しやすい、ネズミで解明
※リンク先に音声動画あり

あなたがそのネズミに出会っても、鳴き声を聞くことはできない。カリフォルニアシロアシマウス(Peromyscus californicus)は、超音波で会話しているからだ。

 彼らの会話は、もとの5%のスピードでスロー再生してはじめて人間に聞こえる音程になる。そうすることで私たちは初めて、このネズミが表現力豊かな声をもっていたことを知るのだ。

「ネズミは哺乳類のなかでも特に多様性に富むグループです。鳴き声は、ネズミの生理のなかでもあまり注目されてこなかった部分です」と、10年ほど前にカリフォルニアシロアシマウスの鳴き声に気づいた米ノースカロライナ大学グリーンズボロ校の生物学教授マティーナ・カルコウニス=ルペル氏は語る。

 スロー再生したカリフォルニアシロアシマウスの鳴き声は、クークーという優しい声からぎょっとするような吠え声まで幅広い。

 米ウィスコンシン大学マディソン校の研究者ジョシュ・パルトラック氏らの研究チームは、その会話を読み解くことで、このネズミの社会生活や繁殖について考察、学術誌『Frontiers in Ecology and Evolution(生態学と進化のフロンティア)』誌に発表した。一夫一婦制で暮らすこのネズミのつがいはいったん引き離されると、ケンカしたり、溝を埋められない場合があるという。

■いちゃいちゃしたり、怒ったり

 パルトラック氏が今回の研究で記録したネズミの鳴き声をいくつか紹介しよう。最初に3回聞こえる鳥のさえずりのような鳴き声は、親しみを示す最も一般的な鳴き声だ。次に2回聞こえる少し長い鳴き声は、パルトラック氏によれば、ネズミが「いちゃいちゃ」しているときの鳴き声、最後に1回聞こえるクジラの歌のような長い鳴き声も親しみを表すもので、関係の強まりを示している。

 怒りの声は、ネズミのつがいを引き離して別のネズミと一緒にし、その後で元の相手と再会させた場合に聞かれた。約半数のネズミがこのような反応を示した。

「夫婦ゲンカ」をしたネズミたちも、最終的には元のさやに収まった。しかし、より早い時期に親しみを込めた鳴き方に戻ったカップルや、全然ケンカにならなかったカップルの方が、健康な子どもを産み育てることが多かった。

 つまり、これらのネズミが「夫婦の危機をやりすごすことには繁殖上の利益があるのです」とパルトラック氏は言う。

続きはソースで

https://cdn-natgeo.nikkeibp.co.jp/atcl/news/18/121000540/ph_thumb.jpg

ナショナルジオグラフィック日本版サイト
https://natgeo.nikkeibp.co.jp/atcl/news/18/121000540/
ダウンロード (6)


引用元: 【動物】超音波でしゃべるネズミの会話、スロー再生で解読[12/11]

超音波でしゃべるネズミの会話、スロー再生で解読の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/06/22(金) 16:57:23.74 ID:CAP_USER
人類は習慣や伝統を何世代にもわたって伝えることで、地域に密着した文化を形成する特徴を持っています。
ロンドン大学クイーン・メアリーの心理学者であるロバート・ラクラン氏らの研究チームによると、ヌマウタスズメにも人間と同様の傾向があり、ヌマウタスズメのさえずりは何百年にもわたって伝承されていることが明らかになっています。

Cultural conformity generates extremely stable traditions in bird song | Nature Communications
https://www.nature.com/articles/s41467-018-04728-1

Birds Have Time-Honored Traditions Too | Duke Today
https://today.duke.edu/2018/06/birds-have-time-honored-traditions-too

研究チームはニューヨーク州に住むヌマウタスズメが3拍子の歌を繰り返して歌い、ミネソタ州では4拍子の歌を好むなど、地域によって異なる歌を歌う傾向があることに気づいたそうです。
そこで、ラクラン氏らは「若いヌマウタスズメは先輩の歌を学びとって、歌っているのかもしれない」と考えるようになり、本当に歌が伝承されているのか調査を行うことにしました。

続きはソースで

https://i.gzn.jp/img/2018/06/21/birds-time-honored-traditions/00_m.jpg

GIGAZINE
https://gigazine.net/news/20180621-birds-time-honored-traditions/
ダウンロード (1)


引用元: 【動物】「鳥の歌(さえずり)は何百年にもわたって伝承されている」と研究者が指摘[06/21]

「鳥の歌(さえずり)は何百年にもわたって伝承されている」と研究者が指摘の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/06/22(金) 00:11:48.10 ID:CAP_USER
馬が人の表情と声を関連付けて感情を読み取れることが分かったと、北海道大大学院の滝本彩加准教授(動物心理学)らのチームが21日、英科学誌電子版に発表した。

 滝本准教授によると、馬が人の怒った表情に警戒心を抱くことは先行研究で示されていたが、声との関連付けが明らかになったのは初めて。

続きはソースで

プロジェクターで投影した人の顔を馬に見せ、反応を調べる実験
https://nordot-res.cloudinary.com/t_size_m/ch/images/382515715464250465/origin_1.jpg

共同通信
https://this.kiji.is/382515726273037409
ダウンロード


引用元: 【動物】馬は人の心読み取れる、表情と声関連付け 北大発表[06/21]

馬は人の心読み取れる、表情と声関連付け 北大発表の続きを読む

このページのトップヘ