理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

文字

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/07/12(金) 04:35:09.76 ID:CAP_USER
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発(記事全文は、ソースをご覧ください。)
https://pc.watch.impress.co.jp/docs/news/1195499.html
2019年7月11日 12:12
PC Watch,Impress,インプレス,笠原 一輝


https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/001_l.jpg
(画像)くずし字で書かれた古文書を手に持つ情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏

 Googleは都内のオフィスにおいて、「Solve....with AI」というアジア太平洋地域の記者などを集めたイベントを開催し、Google Cloud Platform(GCP、Googleのパブリッククラウドサービス事業)などを通じて提供している各種のAIサービスやTensorFlowなどの機械学習(マシンラーニング)ベースのAIを開発するツールなどのソリューションや、その具体的な利用事例などを紹介した。

 このなかで、情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員および国立情報学研究所のタリン・カラーヌワット氏は、日本語の古文書で一般的に使われている「くずし字」を自動で読み取って現代語に翻訳(正確には翻刻)するOCR「KuroNet」を開発し、Webブラウザ上で実行可能な機械学習ライブラリとなるTensorFlow.jsとしてくずし字の文字認識が可能になるようにしたと説明した。

【お詫びと訂正】本AIの開発にはGoogleの技術も用いられていますが、AI自体をGoogleが開発したと誤解を招く表現がありましたので、お詫びして訂正させていただきます。また、このプロジェクトの作業内容は正確には翻訳ではなく翻刻と呼ぶのが正しいので、その旨付記をいたしました。

・百数十年前までは皆が読めていた「くずし字」。今は人口の0.01%以下しか読めないという現実

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/002_l.jpg
(画像)くずし字と現代語、確かに現代人からすると日本語なのに読めない

 7月10日にGoogleの東京オフィスで行なわれたイベントに登壇した情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏は、「日本では1千年にわたりくずし字という筆記体の文字を使ってきた。しかし、現代の印刷システムではそれを使うことは難しく、20世紀に入って現代語へと変換が進められてきた。その結果、くずし字で書かれた数百万の古文書や古書が現存するが、それらは人口の0.01%以下の人しか読むことができない」という問題を指摘した。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/003_l.jpg
明治時代に印刷システムの要求から筆記体のくずし字から現代語への転換が図られた

 たとえば江戸時代の古典籍はくずし字と呼ばれる筆記体の日本語で書かれている。文法などは現代語と大きな違いはない(厳密に言うと主語が省略されることが多いなど微妙な違いはある)のだが、そもそも文字が識別できないので読めないという問題がある。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/004_l.jpg
(画像)数百万のくずし字で書かれた古文書があるのに人口の0.01%以下の人しか読めないという現実

続きはソースで

ダウンロード (6)

引用元: 【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12]

AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/05/13(月) 12:10:16.39 ID:CAP_USER
【5月10日 AFP】
秘密のラブレターか、はたまたもっと謎めいたメッセージか──フランス北西部ブルターニュ(Brittany)地方の海岸の岩に刻まれた文字の解読に、地元の村が2000ユーロ(約24万6000円)の懸賞金をかけている。

 岩はブルターニュ地方フィニステール(Finistere)県プルガステルダウラ(Plougastel-Daoulas)村の外れの海岸にあり、干潮時にしか姿を現さない。地元では大英博物館(British Museum)のロゼッタ・ストーン(Rosetta Stone)になぞらえられることもあるという。

続きはソースで

(c)AFP

https://afpbb.ismcdn.jp/mwimgs/f/f/-/img_ff39b6dfaf105e2fa987147c7679ac54367636.jpg
https://afpbb.ismcdn.jp/mwimgs/1/c/-/img_1cf68e6479003c5b6ab0f13ad3bc3d25266558.jpg
https://afpbb.ismcdn.jp/mwimgs/9/7/-/img_97ed42e66d984b39d3ade6a42bbef7af273300.jpg
https://afpbb.ismcdn.jp/mwimgs/c/1/-/img_c1849035bbc29dbea9e629db2498a3dc236092.jpg

https://www.afpbb.com/articles/-/3224414
ダウンロード (2)


引用元: 仏版「ロゼッタ・ストーン」か、岩に刻まれた文字解読に懸賞金[05/10]

仏版「ロゼッタ・ストーン」か、岩に刻まれた文字解読に懸賞金の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/04/05(金) 05:39:47.52 ID:CAP_USER
・上智大学の研究により、猫が自分の名前を認識していることが分かった
・自分の名前を呼ばれた猫が反応することから、言葉が区別できていると判明
・研究者によると、人にかまってもらいたいときだけ反応するという

 ネコは名前を呼んでも反応せず、そっけないイメージがあるが、自分の名前が呼ばれていることはきちんと認識していることが上智大の斎藤慈子(あつこ)准教授(比較認知科学)らの研究で分かった。

 英科学誌電子版に4日、論文が掲載された。

 家庭や猫カフェで飼われているネコ78匹を対象に、自分の名前と文字数が同じで抑揚が近い4つの言葉を呼びかけた後、名前を呼ぶ実験を行った。

続きはソースで

https://livedoor.blogimg.jp/kemofre/imgs/8/e/8ed70ff9.jpg

産経新聞
https://www.sankei.com/life/news/190404/lif1904040036-n1.html
ダウンロード


引用元: 【動物】猫は自分の名前が呼ばれていることを認識 上智大学の研究で判明[04/04]

猫は自分の名前が呼ばれていることを認識 上智大学の研究で判明の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/02/21(木) 16:07:23.17 ID:CAP_USER
弥生時代中期中ごろから後半(紀元前2世紀末~前1世紀)に石製の硯(すずり)を製作していたことを示す遺物が、北部九州の複数の遺跡にあったことが、柳田康雄・国学院大客員教授(考古学)の調査で明らかになった。国内初の事例。硯は文字を書くために使用したとみられ、文字が書かれた土器から従来は3世紀ごろとされてきた国内での文字使用開始が300~400年さかのぼる可能性を示す貴重な資料となる。

硯の遺物が見つかったのは、潤地頭給(うるうじとうきゅう)遺跡(福岡県糸島市)=前2世紀末▽中原遺跡(佐賀県唐津市=同▽東小田峯遺跡(福岡県筑前町)=前1世紀=の3遺跡。既に出土していた石製品を柳田客員教授が再調査したところ、末広がりになる形状の薄い板で、表が磨かれ裏が粗いままという硯の特徴を示しながら、仕上げがされずに破損したものがあり、未完成品だった。墨をつぶす研ぎ石の未完成品や、石材を擦って切断する道具・石鋸(いしのこ)も確認され、現地で硯が製作されたと判断した。

続きはソースで

■福岡県糸島市の潤地頭給遺跡で出土した工作用の石鋸(上2点)と石製硯の未完成品(下
https://cdn.mainichi.jp/vol1/2019/02/19/20190219k0000m040232000p/6.jpg
https://cdn.mainichi.jp/vol1/2019/02/19/20190219k0000m040231000p/6.jpg

毎日新聞
https://mainichi.jp/articles/20190219/k00/00m/040/236000c
images


引用元: 【考古学】北部九州に紀元前の硯製作跡 国内の文字使用開始、300年以上さかのぼる可能性[02/19]

北部九州に紀元前の硯製作跡 国内の文字使用開始、300年以上さかのぼる可能性の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/10/11(木) 22:02:25.28 ID:CAP_USER
〈質問〉
漢字にも方言のような地域による違いがあると聞きました。具体的にどのようなものがあるでしょうか。

〈解答〉
■見付かる地域差

地域性を帯びた文字を方言文字あるいは地域文字,それが漢字であれば方言漢字とも呼びます。中国は国土が広く,方言差も激しいため,古くから各地で方言漢字が作られ,用いられてきました。

日本列島では,北海道から沖縄まで各地に存在しています。奈良時代以前より,金石文,木簡,文書や書籍では使用漢字に地域による変異が現れ,とくに近世以降,文芸や固有名詞の表記などに多数出現します。

近世から言及がなされ始め,近代以降は柳田国男,永野賢,柴田武,見坊豪紀,鏡味明克ほかがそれぞれの立場から概念と実例を提示してきました。

※墹之上(ままのうえ) 2018.1.2 静岡県伊豆の国市にて撮影
https://kotobaken.jp/wp-content/uploads/2018/09/qa70_01.jpg

■実例としては

字(字種)としては,東北の「萢」(やち)「轌」(そり),関東の「圷」(あくつ),京都の「椥」(なぎ),中国地方の「嵶」「垰」「乢」(たお,たわ,とう),九州の「椨」(たぶ 旁が符,鹿,虫などの異体字もある)などが挙げられます。「閖上」など宮城の地名に使われる「閖」(ゆり)は,江戸時代の藩主による造字という伝承に対し,大水・水害という字義・用法がより古くにあったことが指摘できます。国字,国訓の一種に分類され,造字の方法は,六書で言うと会意文字が多いのですが,対馬の「𨺉」(さい)のように形声文字も見られます。

名古屋の「杁中」(いりなか)のように駅名では当用漢字表にないからといって仮名表記にされたケースがあります。また,岡山の「穝」(さい)のようにJIS第2水準に採用されそこなった結果,誤植されることが増えたケースのほか,違う地名に変更されたケースもあります。

※杁中(いりなか) 2017.12.16 愛知県名古屋市にて撮影
https://kotobaken.jp/wp-content/uploads/2018/09/qa70_03.jpg

■豊かな特色

中世以降の合字「袰」(ほろ・いや)は,「褜」(えな・いや)とともに東北と九州で地名や姓・人名に残り,周圏分布を呈します。九州では「やん」という語形が訓読みとなっているケースもあります。とくに人名に用いられる場合は,新生児に絡まるなどした胎盤による命名です。袈裟(けさ)と呼ぶ地域もあったため,袈裟の異名「福田衣」からと考えられる合字「畩」(けさ)を人名に当てるケースも薩摩で江戸時代から見られ,地名や姓にも用いられています。

※褜川(いやがわ) 2017.11.26 熊本県宇城市にて撮影
https://kotobaken.jp/wp-content/uploads/2018/09/qa70_02.jpg

隅田川を指す「濹」(ボク)は,近世の漢学者の造字ですが,永井荷風が書名に用いたことで全国的に認知されるに至ります。頼山陽は淀川に「氵奠(1字)」という字を作りました(個人文字であり,地域文字でもあります)。現代でも,日本に暮らす中国人の和平氏が神田川を「氵神(1字)」で表すような例が生まれています。

■多彩な使われ方

漢字の「隈」は大隈のように地名や姓で九州に多く,「辻」は地名や姓のほか,今なお普通名詞として近畿では根強く使われています。人名(下の名前)では神奈川や奈良で県名から取って「奈」を用いるケースが多いのです。

固有名詞以外では,エスカレーターなどに見られる「非常停止ボタン」の表示に用いられている「釦」(ボタン)は,近畿地方では使用がまれとなりました。漢字で64画もある「𪚥」(龍が四つ)は,和歌山の旧・龍神村(現・田辺市龍神村)辺りの俚言りげんである「てち」(すごい,勢いがよいという意味)に当てるようになっています。

https://kotobaken.jp/qa/yokuaru/qa-70/


https://kotobaken.jp/wp-content/uploads/2018/09/qa70_05.png 

続きはソースで


images (2)

引用元: 【言語学】漢字にも方言のような地域による違いがありますか/ことばの疑問[10/09]

漢字にも方言のような地域による違いがありますか/ことばの疑問の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/07/11(水) 13:08:44.86 ID:CAP_USER
【7月11日 AFP】
ギリシャ文化省は10日、ホメロス(Homer)の古代叙事詩「オデュッセイア(Odyssey)」の13行が刻まれた粘土板がペロポネソス(Peloponnese)半島のオリンピア(Olympia)遺跡で発見されたと発表した。
粘土板はローマ時代の3世紀に遡るとみられ、ギリシャで見つかったオデュッセイアの文字記録としては最古の可能性がある。

 古代オリンピックの舞台となったオリンピア遺跡では、ギリシャ考古学当局がドイツ考古学研究所(German Institute of Archaeology)と協力して3年にわたって表層部の発掘を行っていた。粘土板はゼウス神殿の近くで見つかったという。

続きはソースで

(c)AFP

■ギリシャのオリンピア遺跡で発見された叙事詩「オデュッセイア」の詩文が刻まれた粘土板。
http://afpbb.ismcdn.jp/mwimgs/2/6/810x540/img_26859dc98720ebccf02d913d03ee963e422840.jpg

AFP
http://www.afpbb.com/articles/-/3181976
images (1)


引用元: 【考古学】〈画像〉古代ギリシャ 叙事詩「オデュッセイア」刻んだ3世紀の粘土板発見 ギリシャ最古の記録か[07/11]

〈画像〉古代ギリシャ 叙事詩「オデュッセイア」刻んだ3世紀の粘土板発見 ギリシャ最古の記録かの続きを読む

このページのトップヘ