理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

日本語

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2017/12/25(月) 06:08:16.97 ID:CAP_USER
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。

続きはソースで

NHKニュース
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
images


引用元: 【IT】コンピューターで全漢字使用可に 6万字コード化

コンピューターで全漢字使用可に 6万字コード化の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2017/07/17(月) 14:08:09.93 ID:CAP_USER9
 総務省は人工知能(AI)を活用し、日本語の特性に最適な国産の会話システムを官民共同で開発する方針を固めた。

 来年度から実証試験を始め、2020年の実用化を目指す。この分野では、米アマゾン・ドット・コムなどの海外勢が先行しているが、次世代の高速通信規格「5G」にも対応し、その場に話し相手がいるかのように自然な日本語の会話ができるシステムで対抗する。

続きはソースで

http://yomiuri.co.jp/economy/20170716-OYT1T50104.html
http://yomiuri.co.jp/photo/20170717/20170717-OYT1I50020-1.jpg
ダウンロード


引用元: 【技術】相手いるように自然な会話…AI活用しシステム 総務省主導で官民共同開発©2ch.net

相手いるように自然な会話…AI活用しシステム 総務省主導で官民共同開発の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: リキラリアット(芋) 2013/12/30(月) 18:21:26.56 ID:ftk2Lgh30 BE:1607270764-PLT(12000) ポイント特典

百度ソフト、便利で人気だが「まるでウイルス」

 「まるでウイルス」――。

 パソコンに入力した文字列を全て外部に送信してしまう中国社製の日本語入力ソフト「バイドゥIME」。
国民の大切な情報を扱う役所や大学でも気づかないまま使われていたことに、関係者はショックを受ける。
便利なソフトなだけに人気も高く、推定利用者は200万人以上。専門家は「便利なITサービスでも、利用者に仕組みを正しく伝えなければ、悪性のウイルスと同じになってしまう」
と指摘する。

 先端技術など知的財産を扱う教育研究機関でもソフトが見つかったが、「自由な気風を大切にする大学では、ソフトの規制は難しい」とある大学関係者は漏らす。職員など事務系の端末計約600台中16台から発覚した東工大のセキュリティー担当者も「事務系端末はまだ把握できるが、研究者や学生の持ち込んだパソコンまで管理できず、全体像はつかめない」と打ち明ける。

 バイドゥIMEは、数年前から登場した「クラウド変換」という機能が導入された便利なソフトでもある。
変換機能を向上させるため、サーバーに利用者の入力情報を送り、学習させているとみられる。
東工大の担当者は、「利用者の便宜を考えた機能だとは理解できる」としながらも、キーボードで入力した内容を監視する「キーロガー」というウイルスと「まるで同じだ」と批判する。
9

http://amd.c.yimg.jp/im_siggWGz1SfnbD683Hetv_3JHAA---x334-y450-q90/amd/20131226-00000267-yom-000-1-view.jpg

http://headlines.yahoo.co.jp/hl?a=20131226-00000267-yom-sci



【キーロガーウイルス】中国・百度IMEをPCにインストールしていた大学リスト公開 入ってたらFランなの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: ( ´`ω´) ◆ChahooS3X2 @ちゃふーφ ★ 2013/11/30(土) 03:43:34.71 ID:???0

Google は、話し言葉を理解して最適な回答を声で応答する、新たな音声検索機能を発表しました。
Android や iOS のGoogleの検索アプリからすでに利用できます。

新しい音声検索機能は、日本語の話し言葉を理解し、検索したユーザーの意図により近い検索結果を出すというものです。要するに iPhoneのSiriや、ドコモのしゃべってコンシェルのような、話し言葉を理解する機能が強化されたということ。

音声で検索し、検索結果の中から最適(と思われる)な検索結果を音声で返します。発表会では、「ピカソはどこで生まれたの?」と音声で質問、検索結果の表示とともに「ピカソはスペインのマラガで生まれました」と返答がありました。

GoogleのWeb検索データベースは、「ピカソ」が人名であり、アーティストであるという情報(ナレッジグラフ)を持っており、音声入力でもこの情報を活用して、最適(と思われる)な結果を返します。話言葉の中に最適な答えがない場合、音声回答はありません。

このほか、「○○へ行きたい」と言えばナビ画面でルート検索が始まるほか、「○○は何歳?」
「スリランカの首都は?」など、クイズのような質問にも答えてくれます。

アプリはAndroid 4.1以上、iOS 6.0以上、PCはChromeブラウザでも利用可能。なお、音声応答機能は日本語だけでなく、米国や英国、フランス、ドイル、イタリア、スペイン、韓国語の各国語に対応
engadget http://japanese.engadget.com/2013/11/29/google/

1caf0de5.jpg
eb6b55dc.jpg

http://hss-prod.hss.aol.com/hss/storage/adam/c4e3ffa242eed01af22322e0c53c0c6e/IMG_4447.jpg
http://hss-prod.hss.aol.com/hss/storage/adam/6d5f28e1db0b79984ecffc9da51fea2/IMG_4440.jpg



【IT】 Google音声検索がアップデート、日本語の話し言葉に声で回答の続きを読む

このページのトップヘ