理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

識別

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/07/12(金) 04:35:09.76 ID:CAP_USER
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発(記事全文は、ソースをご覧ください。)
https://pc.watch.impress.co.jp/docs/news/1195499.html
2019年7月11日 12:12
PC Watch,Impress,インプレス,笠原 一輝


https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/001_l.jpg
(画像)くずし字で書かれた古文書を手に持つ情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏

 Googleは都内のオフィスにおいて、「Solve....with AI」というアジア太平洋地域の記者などを集めたイベントを開催し、Google Cloud Platform(GCP、Googleのパブリッククラウドサービス事業)などを通じて提供している各種のAIサービスやTensorFlowなどの機械学習(マシンラーニング)ベースのAIを開発するツールなどのソリューションや、その具体的な利用事例などを紹介した。

 このなかで、情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員および国立情報学研究所のタリン・カラーヌワット氏は、日本語の古文書で一般的に使われている「くずし字」を自動で読み取って現代語に翻訳(正確には翻刻)するOCR「KuroNet」を開発し、Webブラウザ上で実行可能な機械学習ライブラリとなるTensorFlow.jsとしてくずし字の文字認識が可能になるようにしたと説明した。

【お詫びと訂正】本AIの開発にはGoogleの技術も用いられていますが、AI自体をGoogleが開発したと誤解を招く表現がありましたので、お詫びして訂正させていただきます。また、このプロジェクトの作業内容は正確には翻訳ではなく翻刻と呼ぶのが正しいので、その旨付記をいたしました。

・百数十年前までは皆が読めていた「くずし字」。今は人口の0.01%以下しか読めないという現実

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/002_l.jpg
(画像)くずし字と現代語、確かに現代人からすると日本語なのに読めない

 7月10日にGoogleの東京オフィスで行なわれたイベントに登壇した情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏は、「日本では1千年にわたりくずし字という筆記体の文字を使ってきた。しかし、現代の印刷システムではそれを使うことは難しく、20世紀に入って現代語へと変換が進められてきた。その結果、くずし字で書かれた数百万の古文書や古書が現存するが、それらは人口の0.01%以下の人しか読むことができない」という問題を指摘した。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/003_l.jpg
明治時代に印刷システムの要求から筆記体のくずし字から現代語への転換が図られた

 たとえば江戸時代の古典籍はくずし字と呼ばれる筆記体の日本語で書かれている。文法などは現代語と大きな違いはない(厳密に言うと主語が省略されることが多いなど微妙な違いはある)のだが、そもそも文字が識別できないので読めないという問題がある。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/004_l.jpg
(画像)数百万のくずし字で書かれた古文書があるのに人口の0.01%以下の人しか読めないという現実

続きはソースで

ダウンロード (6)

引用元: 【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12]

AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/06/09(日) 05:15:58.79 ID:CAP_USER
赤ちゃんの泣き声の意味をAIで聞き分けることが可能に
https://gigazine.net/amp/20190607-ai-understand-baby-different-cries
2019年06月07日 14時00分00秒
GigaZiNE

 赤ちゃんの泣き声は親を心配にさせたり、イライラさせたりするものです。
 そんな赤ちゃんの泣き声を人工知能(AI)を用いて聞き分けることで、「正常な泣き声」と「異常な泣き声」を区別するという研究が進められています。

 Infant cry language analysis and recognition: an experimental approach - IEEE Journals & Magazine
 https://ieeexplore.ieee.org/document/8657383

 Artificial intelligence that can understand meaning of a baby’s different cries- Technology News, Firstpost
 https://www.firstpost.com/tech/science/artificial-intelligence-to-understand-meaning-behind-the-different-babies-cries-6766841.html

 赤ちゃんはお腹が減ったり、病気で体調が悪くなったりすると泣きますが、それだけでなく親の気を引くために泣くこともあります。
 熟練の親や専門家であれば乳児の泣き声の意味をある程度理解することができるため、泣き声の意味を正確に認識することは可能であると考えられてきました。

 そこで、さまざまな意味合いを持つ幼児の泣き声の「周波数的領域における音声特徴」を分析し、「乳児が泣いている理由」を認識しようとしたのが、
 ノーザン・イリノイ・ユニバーシティの電気工学科で准教授を務めるLichuan Liu氏が率いる研究チーム。

 研究チームは線形予測符号を用いて乳児の泣き声から線形予測ケプストラム係数(LPCC)、バーク周波数ケプストラム係数(BFCC)、メル周波数ケプストラム係数(MFCC)といった形で音の特徴を抽出。

続きはソースで

ダウンロード


引用元: 【情報処理工学/AI】赤ちゃんの泣き声の意味をAIで聞き分けることが可能に[06/07]

【情報処理工学/AI】赤ちゃんの泣き声の意味をAIで聞き分けることが可能にの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/04/10(水) 17:25:43.53 ID:CAP_USER
ニューヨーク市内で実施された顔認識システムの試験運用で、ドライバーの顔を誰一人として識別できなかったことが判明した。ウォール・ストリート・ジャーナル紙(WSJ)が報じている。

WSJが入手したニューヨーク都市圏交通公社(MTA)内部の電子メールに、2018年、ロバート・F・ケネディ橋(RFK)で実施された試験運用の詳細が書かれていた。試験運用では、橋に取り付けたカメラが走行中の車両のフロントガラス越しにドライバーの顔を捉えて識別し、政府のデータベースと照合するものだった。

ところが、昨年11月に作成された文書によると、「RFKで実施された概念実証試験の1回目の運用期間が完了したものの、許容可能な範囲内で検出された顔は皆無(0%)で、失敗に終わった」と記されていた。つまり、一人も正確に顔を認識できなかったということだ。ところがこの失敗にもかかわらず、広報担当者によると、MTAはより多くのカメラを他の橋やトンネルに設置する見通しだという。

続きはソースで

https://www.technologyreview.jp/nl/new-yorks-mass-face-recognition-trial-on-drivers-has-been-a-spectacular-failure/
ダウンロード (5)


引用元: 【IT】ニューヨークの顔認識実験が大失敗、成功率はまさかのゼロ[04/10]

ニューヨークの顔認識実験が大失敗、成功率はまさかのゼロの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/04/28(日) 21:41:58.14 ID:CAP_USER
専門雑誌に掲載された難解な論文を読み込み、科学的背景を持たない読者にもわかりやすいようにかみ砕いて文章として伝える「サイエンスライター」と同じように機能するAIをマサチューセッツ工科大学(MIT)の研究者らが発表しました。

Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications | Transactions of the Association for Computational Linguistics | MIT Press Journals
https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00258

Rotational Unit of Memory
http://super-ms.mit.edu/rum.html

Can science writing be automated? | MIT News
http://news.mit.edu/2019/can-science-writing-be-automated-ai-0418

MITの大学院生であるRumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。AIが生成できる文章は非常に短いため、2019年4月時点では実際のサイエンスライターが作成するような記事を作り出すことはできないとのことですが、大量の論文を読む際に軽くチェックして内容を予備的に把握するのに役立つ可能性があります。

もともと、研究チームは物理学的な問題に対処することを目的としてAIでのアプローチを試みていたそうで、論文の要約などの処理に焦点を当てていなかったそうです。ところが、研究チームは自身が開発したアプローチが物理学の分野だけでなく、自然言語処理を含むほかの分野にも同じアプローチが適用できることに気づいたとのこと。

一般的なニューラルネットワークは、コンピューターが非常に多くの事例についてのパターンを「学習」して進歩します。たとえば写真に写っているオブジェクトを識別したり、写真や音声から特定のものを抜き出したりするシステムに、ニューラルネットワークは広く活用されています。

その一方で、ニューラルネットワークは長い一連のデータから情報をピックアップし、関連付けることが困難だとのこと。この能力は長い論文から必要な情報を見つけ出して要約する、サイエンスライターのような仕事に求められる技術の一つです。長距離の依存関係をモデル化する長期短期記憶(LSTM)ネットワークなどの手法がこの問題を解決するために使用されていますが、自然言語処理を実用的なものに近づけるには至っていません。

研究チームは従来のニューラルネットワークに使われてきた行列の乗算に基づくシステムではなく、多次元空間で回転するベクトルに基づく代替システムを考案しました。このシステムは「記憶回転単位(rotational unit of memory)」と名付けられており、研究チームは「RUM」と呼んでいます。RUMはニューラルネットワークが要素を記憶するのを助け、より正確に要素を思い出すことにも有効とのこと。RUMはもともと光の振る舞いのような複雑な物理学的問題を解決するために考案されたアプローチでしたが、やがて研究チームはRUMが自然言語処理のような他分野でも有用である可能性に気づきました。
https://i.gzn.jp/img/2019/04/27/science-writing-be-automated/03_m.png

続きはソースで
ダウンロード (3)


引用元: 【AI】「難解な論文をわかりやすく要約してくれるAI」が開発される[04/27]

「難解な論文をわかりやすく要約してくれるAI」が開発されるの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/04/14(日) 20:09:11.79 ID:CAP_USER
横浜国立大学工学研究院の濱上知樹教授らの研究グループは、男性不妊治療において胚培養士が行う TESE(Testicular Sperm Extraction: 精巣内精◯採取術)を、人工知能(AI)を使って支援するシステムを開発した。

 男性不妊の中でも無精◯症の症例数は2~16%を占めると言われている。その治療方法としては、精巣から精◯を採取する技術であるTESEが知られているが、この方法は限られた時間で有望な精◯を見つけて回収するため、高い細胞識別能力が要求される。そのため胚培養士の負担は極めて高く、成功率を上げるための精◯の探索・評価の支援技術が求められていた。

 今回、同グループは、精◯採取動画から約17万個の細胞サンプルを抽出し、それぞれについて精◯・非精◯の学習を行った。

続きはソースで

参考:【横浜国立大学】AI による精◯判別・評価システムを開発(PDF)
https://www.ynu.ac.jp/hus/koho/22019/34_22019_1_1_190403015502.pdf

https://univ-journal.jp/25482/
ダウンロード


引用元: 【生殖医療】有望な精子を人工知能が判別・評価するシステムの開発に成功[04/14]

有望な精○を人工知能が判別・評価するシステムの開発に成功の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/10/01(月) 13:29:20.56 ID:CAP_USER
京都大大学院生の森本千恵さん(26)が、有望な若手女性研究者に贈られる「ロレアル・ユネスコ女性科学者日本奨励賞」を受賞した。遠い血縁関係を識別できる新手法を開発した業績が評価された。森本さんは「手掛かりの少ない孤独死や災害死などの身元確認で生かしてほしい」と話している。

 DNAは、人間に必要なたんぱく質を作る情報を伝える「塩基」が連なったもので、DNA鑑定は塩基の並び方の違いから個人を識別する。現場に残されたDNAから容疑者を特定する犯罪捜査だけでなく、親子関係の有無を調べる血縁鑑定にも用いられている。

 森本さんは京大医学部人間健康科学科でDNA検査法を学んだ。卒業後の進路を考える際、東日本大震災で身元不明の遺体が多いことを知り、「より深くDNA鑑定技術を研究したい」と、大学院で法医学を専攻することにした。

 DNAは親から子へと引き継がれるため、血縁が近いほど同じDNA配列が増えるという。

続きはソースで

■DNA鑑定の新手法を開発した森本さん
https://www.yomiuri.co.jp/photo/20180927/20180927-OYT1I50019-N.jpg

読売新聞
https://www.yomiuri.co.jp/science/20180927-OYT1T50067.html
ダウンロード (5)


引用元: 【遺伝子検査】「6親等まで血縁識別」大学院生の開発にロレアル・ユネスコ女性科学者日本奨励賞[09/28]

「6親等まで血縁識別」大学院生の開発にロレアル・ユネスコ女性科学者日本奨励賞の続きを読む

このページのトップヘ