1: 2016/03/27(日) 21:25:21.89 ID:CAP_USER.net
古文書の崩し字、あなたも読めます 画像から似た字検索 (朝日新聞デジタル) - Yahoo!ニュース
http://headlines.yahoo.co.jp/hl?a=20160327-00000019-asahi-ent


 読めない崩し字を解読します――。漢字の画像を入力すると、木簡や古文書の中からよく似た字を探し出してくれるシステムの運用が25日、始まった。奈良文化財研究所と東京大史料編纂(へんさん)所が共同で開発。そうしたシステムは初めてで、研究者だけでなく、一般の人もインターネットで無料活用できる。

 両機関はこれまで、漢字入力によって木簡や古文書の文字を検索できる、二つのデータベース(DB)を共同で運用してきた。

 今回、それらのDBを援用。知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし、ホームページ(HP)の所定欄に入れると、似た漢字の画像と出典、楷書体の漢字が表示される仕組みだ。

 収録しているのは、主に奈良時代の木簡の約650字(画像数5166)と、奈良~江戸時代の手紙や記録、書物などの約5800字(同2万4296)。代表的な漢字を選んだという。

 「似ている度合い」を機械的に判断するため、人の目では似ているとは見えない字が示され、判読につながる可能性があるという。例えば、平城京にウリを届けた内容の木簡にあった「丁」に続く文字は長らく判読できなかったが、このシステムを使うと「仕」が示され、雑役を担う「仕丁」の意味らしいとわかったという。

 編纂所の井上聡・助教は「古文書の読解に取り組む方々から問い合わせを頂くこともあるが、なかなか応じきれなかった。最先端の研究から趣味まで、広く役立つと思う」と話す。

images
 

引用元: 【情報技術】古文書の崩し字、あなたも読めます 画像から似た字検索

4: 2016/03/27(日) 21:36:26.55 ID:zflKg9bC.net
>>1
>知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし

はぁ?
自動検知しろよ。つかえねーな

5: 2016/03/27(日) 21:43:53.25 ID:Q7/Fll+U.net
春画展で、書いてある崩し字が読めたら良いのになぁ、と思いながら見てたわ。

6: 2016/03/27(日) 21:47:57.73 ID:Gf5NyYbW.net
前後関係で推測するしかないような字っぽい何かの場合もあるんですが

7: 2016/03/27(日) 21:59:37.55 ID:M+D07Fgo.net
※本当に判読が難しい文字はプロの学者が判読します。

8: 2016/03/27(日) 22:02:52.00 ID:uHQPhwfF.net
毛筆ってすごいよね
古代の人間の
性格とか人格とか
書いてるときの気分とか
その時の湿度とか
書いてある文字の情報以外の情報がいろいろ察しはかれて
情報量がすごい。

13: 2016/03/27(日) 23:31:00.75 ID:/o3XpPgj.net
>>9
まともな教育親に施されてたら読めるし、そういう親が少ないから日本人が日本語読めなくなってるんだよね
変態仮名と正漢字崩しただけで読めないって異常なんだよ

戦後最初の文部大臣、安倍能成って腐れ売国奴が、正式な漢字を旧字とかつけて封印したから日本語がぶっ壊された
本人曰く、ごめん間違ってたーで現在まできてる

まともな家は家庭の教育の中で教えてるからね
俺は能の為に強制されただけだが

20: 2016/03/28(月) 11:07:13.14 ID:Ewmu1gTU.net
>>13
康熙字典体かな?
あれって日本で正式に使われるようになったのは明治からだよw
本国では漢字の意味や発音を調べるための漢字辞典なんだけど
日本では皇帝が作った権威ある書ってことで字自体の見本になっちゃったんだよね
日本人は昔から権威に弱かったんだなってw
個人的には篆刻で使われる篆書体が味があって好きだな
書道やっていて少しだけ勉強したけど昔の字も色々種類あって面白いよね

11: 2016/03/27(日) 22:28:29.27 ID:03iLA2gR.net
毛筆の文字がつながっていたら(普通は草書体は繫いで書かれます)
ちゃんと切り分けができるのだろうか?

14: 2016/03/28(月) 10:00:11.39 ID:mG3Ot2cf.net
そんなホームページじゃなくて普通にグーグルに
クロールさせときゃいいだろ

15: 2016/03/28(月) 10:15:41.62 ID:zW/wOKX6.net
従来ありそうでなかった画像認識の応用だな
技術的な新しさはどうだか知らないが、そういうDBを作ったことが画期的

16: 2016/03/28(月) 10:15:55.97 ID:hjYJyoMd.net
この技術があればOCRなんて100%の識字率が達成できそうなんだが

18: 2016/03/28(月) 10:53:28.34 ID:GJbcIVaV.net
関係ないけど奈良時代以前は今の五十音て50音じゃなくて80音ぐらいあったらしいな

まだ、漢字を崩して作ったひらがなカタカナが発明される前だから、漢字を使って書いていた・・・

21: 2016/03/28(月) 11:33:57.59 ID:3TkoMnn4.net
信憑性のある直筆なんてどの位あるんだろうな

22: 2016/03/28(月) 14:20:17.70 ID:GcI7cfFj.net
漢字1文字って、どこからが始まりで1文字の切れ目かなんてわかるやついるのか?

23: 2016/03/28(月) 19:27:20.60 ID:mxLwCWnL.net
使ってみたら候補が沢山あって使い物にならんかった

17: 2016/03/28(月) 10:24:18.49 ID:7fFnrVaE.net
古い毛筆全く読めんよな