理系にゅーす

理系に関する情報を発信! 理系とあるものの文系理系関係なく気になったものを紹介します!

古文書

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/07/12(金) 04:35:09.76 ID:CAP_USER
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発(記事全文は、ソースをご覧ください。)
https://pc.watch.impress.co.jp/docs/news/1195499.html
2019年7月11日 12:12
PC Watch,Impress,インプレス,笠原 一輝


https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/001_l.jpg
(画像)くずし字で書かれた古文書を手に持つ情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏

 Googleは都内のオフィスにおいて、「Solve....with AI」というアジア太平洋地域の記者などを集めたイベントを開催し、Google Cloud Platform(GCP、Googleのパブリッククラウドサービス事業)などを通じて提供している各種のAIサービスやTensorFlowなどの機械学習(マシンラーニング)ベースのAIを開発するツールなどのソリューションや、その具体的な利用事例などを紹介した。

 このなかで、情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員および国立情報学研究所のタリン・カラーヌワット氏は、日本語の古文書で一般的に使われている「くずし字」を自動で読み取って現代語に翻訳(正確には翻刻)するOCR「KuroNet」を開発し、Webブラウザ上で実行可能な機械学習ライブラリとなるTensorFlow.jsとしてくずし字の文字認識が可能になるようにしたと説明した。

【お詫びと訂正】本AIの開発にはGoogleの技術も用いられていますが、AI自体をGoogleが開発したと誤解を招く表現がありましたので、お詫びして訂正させていただきます。また、このプロジェクトの作業内容は正確には翻訳ではなく翻刻と呼ぶのが正しいので、その旨付記をいたしました。

・百数十年前までは皆が読めていた「くずし字」。今は人口の0.01%以下しか読めないという現実

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/002_l.jpg
(画像)くずし字と現代語、確かに現代人からすると日本語なのに読めない

 7月10日にGoogleの東京オフィスで行なわれたイベントに登壇した情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏は、「日本では1千年にわたりくずし字という筆記体の文字を使ってきた。しかし、現代の印刷システムではそれを使うことは難しく、20世紀に入って現代語へと変換が進められてきた。その結果、くずし字で書かれた数百万の古文書や古書が現存するが、それらは人口の0.01%以下の人しか読むことができない」という問題を指摘した。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/003_l.jpg
明治時代に印刷システムの要求から筆記体のくずし字から現代語への転換が図られた

 たとえば江戸時代の古典籍はくずし字と呼ばれる筆記体の日本語で書かれている。文法などは現代語と大きな違いはない(厳密に言うと主語が省略されることが多いなど微妙な違いはある)のだが、そもそも文字が識別できないので読めないという問題がある。

https://pc.watch.impress.co.jp/img/pcw/docs/1195/499/004_l.jpg
(画像)数百万のくずし字で書かれた古文書があるのに人口の0.01%以下の人しか読めないという現実

続きはソースで

ダウンロード (6)

引用元: 【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12]

AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2019/02/24(日) 13:47:43.60 ID:CAP_USER
 中世8〜11世紀にかけてスカンジナビア半島やバルト海で活躍した武装船団バイキング。日本では1970年代に『小さなバイキングビッケ』というアニメ作品をきっかけに知られるようになったが、スウェーデンで100年以上前に見つかった戦士の骨が、実は女性戦士のものであることが判明した!歴史上、最初に見つかった性同一性障害の戦士だったのか?と注目を集めている。

■バイキング時代の要塞都市で140年前に発見

 この遺骨が見つかったのは1878年、首都ストックホルム郊外のメーラレン湖に浮かぶビェルケ(Björkö)島にあるバイキング時代の都市遺跡からだ。

 ビルカ遺跡は、ゲルマン民族が建てたフランク王国の宣教師が9世紀に残した古文書に記録が残り、外敵からの襲来に備えて建てられた要塞都市だったという。


■世界遺産登録されたビルカ遺跡

この遺跡からは3000近い墳墓が見つかっており、このうち1100個は19世紀後半に発掘したもの。当時、考古学者ヤルマー・ストロペ(Hjalmar Stolpe)は王立アカデミーに提出した報告書のなかで、「最も注目に値する墓だ」と記述したほど、ユニークな構造の墓だった。

地下に埋められた木造の部屋の中には、モンゴルの騎馬民族のようなデザインの服装を身に着けた遺骨が残されており、その周囲には斧や剣、槍などの武器類が多数置かれていた。

さらに、サイコロやゲーム用のコマ、鉄製のゲームボードが置かれ、部屋のすみには乗馬用の馬2頭が一緒に埋葬されていたことから、スウェーデンの考古学者は長年、社会的地位が高い将軍クラスの墓だと考えられてきた。

 最初の発見から約100年後の1970年代、Bj581と名づけられた遺骨を調べた研究者が、遺骨のなかに大腿骨が3本あることを発見。二人分の遺体が埋葬されていることがわかったが、その後の調査で、もう一体はBj581より約1世紀古い人物であることが突き止められた。さらにあごと腕の骨から、死亡年齢の推定を試みたが、当時の技術ではうまくいかなかったという。

続きはソースで

https://www.hazardlab.jp/contents/post_info/2/8/3/28323/urn_cambridge.org_id_binary-alt_20190218145703-45526-mediumThumb-S0003598X18002582_fig8g.jpg

上:発掘当時、考古学者が残したスケッチ(Hjalmar Stolpe)、下:スケッチをもとに埋葬当時を想像して描かれた図(Þórhallur Þráinsson/Antiquity Publications Ltd.)
https://www.hazardlab.jp/contents/post_info/2/8/3/28323/ohaka.png
https://www.hazardlab.jp/contents/post_info/2/8/3/28323/urn_cambridge.org_id_binary-alt_20190218145703-18118-optimisedImage-S0003598X18002582_fig5g.jpg
https://www.hazardlab.jp/contents/post_info/2/8/3/28323/urn_cambridge.org_id_binary_20190215143901058-0973_S0003598X18002582_S0003598X18002582_fig6g.jpg


ビルカ遺跡の位置(Antiquity Publications Ltd.)
https://www.hazardlab.jp/contents/post_info/2/8/3/28323/urn_cambridge.org_id_binary_20190215143901058-0973_S0003598X18002582_S0003598X18002582_figU1g.jpg

ハザードラボ
https://www.hazardlab.jp/know/topics/detail/2/8/28323.html
images


引用元: 【考古学】古代バイキング戦士「女」だった!最初の性同一性障害か?[02/24]

古代バイキング戦士「女」だった!最初の性同一性障害か?の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/11/07(水) 13:55:35.52 ID:CAP_USER
 三重県伊賀市の民家から、江戸時代に忍者の師弟が交わした「誓約書」など古文書百三十二点が見つかった。忍術に使う武器を開発したら師匠への報告を約束させ、盗みへの悪用を禁ずるなど、当時の師弟関係がうかがえる内容。資料を分析した三重大国際忍者研究センターの高尾善希(よしき)准教授(近世日本史)は「忍術書がどのような使われ方をしたのかが分かる貴重な史料だ」と話している。

 古文書は同市大野木の木津俊夫さん(68)方から見つかった。木津家は江戸時代の寛永十(一六三三)年から享保七(一七二二)年、伊賀などを治めた藤堂藩に仕え、「伊賀者」として江戸城下の警備役を務めた。

 古文書のうち「忍術起請文(きしょうもん)」は正徳六(一七一六)年、木津さんの祖先・五代目木津伊之助が入門時に師匠・長井又兵衛と交わした誓約書。存在は知られていたが、実物は見つかっていなかった。

 師匠直伝の忍術や道具、忍術書の取り扱いについて、六項目の約束事を規定。「親子兄弟たりといふ共他見他言仕間敷候(中略)人ニ写させ申間敷候(親子や兄弟にも教えない、書き写させない)」と、秘密の厳守を求めている。

<万川集海> 
伊賀と甲賀の全ての忍術を集めたとされる秘伝書。延宝4(1676)年にまとめられた。火器編ではたいまつや火縄、のろしなどについて成分や用法を紹介。「まんせんしゅうかい」「ばんせんしゅうかい」と呼ばれ、写本が残っている。

詳細・続きはソースで

■木津伊之助が師匠の長井又兵衛と交わした「忍術起請文」
http://www.chunichi.co.jp/article/front/list/images/PK2018110702100011_size0.jpg

中日新聞(CHUNICHI Web)
http://www.chunichi.co.jp/article/front/list/CK2018110702000092.html
images


引用元: 【古文書】〈画像〉伊賀忍者、師弟の誓約書 民家で古文書見つかる[11/07]

〈画像〉伊賀忍者、師弟の誓約書 民家で古文書見つかるの続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2018/01/27(土) 02:59:50.56 ID:CAP_USER
1975年にスイス北部バーゼルにある教会の一つで修復作業中に発見された女性のミイラについて、何年にもわたる調査ののち、スイスの研究者らがこのミイラの身元を特定したと、英BBCが25日伝えた。

古文書記録の調査によって、この女性がバーゼルで有名なビショフ家の一員だった可能性があるとの見解が導き出された。

英BBCによると、ミイラの体内からは、15世紀末から19世紀にかけて梅毒の治療に使われていた水銀が発見された。
まさにこの水銀が体内にあったことが、死体の組織が保存されることを促したという。

研究者らは現代的な手法を用いて、ミイラの足の親指からDNA資料を採取することに成功。

続きはソースで

関連ソース画像
https://ichef.bbci.co.uk/images/ic/720x405/p05w33gg.jpg

関連リンク
BBC News - Boris Johnson 'is descendant' of mummified Basel woman
http://www.bbc.com/news/world-europe-42805485

SPUTNICK
https://jp.sputniknews.com/science/201801264512023/
ダウンロード


引用元: 【考古学/遺伝子】スイスで発見のミイラ、英外相の「遠い祖先」と判明[18/01/26]

スイスで発見のミイラ、英外相の「遠い祖先」と判明の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2016/06/02(木) 12:29:41.97 ID:CAP_USER
(CNN) ロンドン考古学博物館(MOLA)は1日、ロンドン中心部の建設現場で2012~14年にかけて、古代ローマ時代の文字を手書きで記した木の板が400枚以上見つかったと発表した。

現場ではブルームバーグ欧州本社の新社屋を建設中。木の板以外にも、50棟以上のローマ時代の建物の跡が見つかったほか、1万5000点もの人工物が出土したという。

400枚以上の木の板のうち、西暦57年1月8日付の金融に関する「古文書」は、英国で見つかった手書き文書としては最も古いものだ。

別の板には「Londinio Mogontio」と書かれている。これは「ロンドンで、モゴンティウスに宛てて」という意味だ。時代は65~80年ごろで、ロンドンに言及した文書としては最も古いものと考えられている。

板からは奴隷や裁判官、醸造業者まで、100人近い人物の名前が見つかった。歴史学者にとっては、ローマ時代のロンドンにおける日々の営みを知るヒントとなるものだ。

これまでロンドンでは、ローマ時代の手書きの板は19枚しか見つかっていなかった。

ローマ時代の「帳簿」は薄いタイルのような形状で、みつろうを塗った板の上に文字を書くようになっていた。長い時間を経てみつろうは剥がれ、文字の跡がついた板の部分だけが残ったわけだ。

幸い、板は湿った泥に埋まっていたため、酸素に触れることなく腐らずに済んだ。板が出土した場所には、かつて川が流れていた。

英国最古の手書き板を含む700を超える出土品は、来年ブルームバーグの新社屋で展示される予定だ。

ダウンロード


http://headlines.yahoo.co.jp/hl?a=20160602-35083609-cnn-int

引用元: 【歴史】古代ローマの手書き板400枚、ロンドンの建設現場から出土©2ch.net

古代ローマの手書き板400枚、ロンドンの建設現場から出土の続きを読む

    このエントリーをはてなブックマークに追加 mixiチェック
1: 2016/03/27(日) 21:25:21.89 ID:CAP_USER.net
古文書の崩し字、あなたも読めます 画像から似た字検索 (朝日新聞デジタル) - Yahoo!ニュース
http://headlines.yahoo.co.jp/hl?a=20160327-00000019-asahi-ent


 読めない崩し字を解読します――。漢字の画像を入力すると、木簡や古文書の中からよく似た字を探し出してくれるシステムの運用が25日、始まった。奈良文化財研究所と東京大史料編纂(へんさん)所が共同で開発。そうしたシステムは初めてで、研究者だけでなく、一般の人もインターネットで無料活用できる。

 両機関はこれまで、漢字入力によって木簡や古文書の文字を検索できる、二つのデータベース(DB)を共同で運用してきた。

 今回、それらのDBを援用。知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし、ホームページ(HP)の所定欄に入れると、似た漢字の画像と出典、楷書体の漢字が表示される仕組みだ。

 収録しているのは、主に奈良時代の木簡の約650字(画像数5166)と、奈良~江戸時代の手紙や記録、書物などの約5800字(同2万4296)。代表的な漢字を選んだという。

 「似ている度合い」を機械的に判断するため、人の目では似ているとは見えない字が示され、判読につながる可能性があるという。例えば、平城京にウリを届けた内容の木簡にあった「丁」に続く文字は長らく判読できなかったが、このシステムを使うと「仕」が示され、雑役を担う「仕丁」の意味らしいとわかったという。

 編纂所の井上聡・助教は「古文書の読解に取り組む方々から問い合わせを頂くこともあるが、なかなか応じきれなかった。最先端の研究から趣味まで、広く役立つと思う」と話す。

images
 

引用元: 【情報技術】古文書の崩し字、あなたも読めます 画像から似た字検索

古文書の崩し字、あなたも読めます 画像から似た字検索の続きを読む

このページのトップヘ