日本の古典や古文書の解読に新戦力AIが威力を発揮

 日本の古典や古文書の解読に新戦力AIが威力を発揮・平安や鎌倉時代の古典・古文書が現代文並に読めるようになるそうだ、 日本の古典文学や古文書などの「くずし字」を解読する人工知能(AI)に注目が集まっている。情報・システム研究機構が開発したAIは、くずし字を瞬時に現代の文字に変換する。今後、国文学研究資料館などと協力し、大量の古典や古文書を解読するプロジェクトに乗り出す。(中居広起)、に関連する最新のWeb情報を引用すると、


古典・古文書の難読「くずし字」、AIが瞬時に解読…精度90%も
11/11(月) 12:10配信     日本の古典文学や古文書などの「くずし字」を解読する人工知能(AI)に注目が集まっている。情報・システム研究機構が開発したAIは、くずし字を瞬時に現代の文字に変換する。今後、国文学研究資料館などと協力し、大量の古典や古文書を解読するプロジェクトに乗り出す。(中居広起) 読売新聞社  専門家でも1ページ10分かかるが、AIなら1秒で  「古典の解読は、専門家でも1ページあたり10分程度はかかります。このAIなら、1ページを1秒間ほどで解読できます」  くずし字解読AIのソフト「KuroNet(クロネット)」を開発した同機構人文学オープンデータ共同利用センター(CODH)のカラーヌワット・タリン特任助教はそう話す。 タリンさんのパソコンの画面に、兼好法師の「徒然草」を表示してもらった。現在私たちが使っている文字とは異なる形の字が多いうえ、上下の字がつながっていてなかなか読めない。 この画像をKuroNetに取り込むと、即座に解読が終わり、くずし字の横に赤字で現代の文字が表示された。一部の文字を読み飛ばすなど正しく解読できていない部分もあるが、大部分は読むことができる。くずし字の解読AIの開発に取り組んでいる情報・システム研究機構のカラーヌワット・タリンさん
誰でも使えるよう、ホームページで公開予定
 タイ出身のタリンさんは、「源氏物語」をきっかけに日本の古典文学に興味をもち、早稲田大に留学。源氏物語の注釈書などの研究で博士(文学)を取得した。 多くの時間と労力を、くずし字の解読に費やした経験から、「くずし字を効率良く解読するシステムを、自分で作ろう」と思い立った。 膨大なデータをもとに自ら学ぶディープラーニング(深層学習)の仕組みを初歩から学び、KuroNetを開発した。AIには約68万字分のくずし字を学習させた。変体仮名や草書体の漢字などを含むくずし字約2400種を認識し、江戸時代の文献なら90%の精度で解読できるという。 今年11月までに学習の対象を約100万字に増やし、さらに精度を高めたうえで、誰でも使えるようにホームページで公開する予定だ。  読売新聞社
文字の切れ目、わかりにくかったが…
 くずし字は前後の文字がつながっていて、切れ目がわかりにくい。文字を最初から順番に読み込む場合、1文字の領域を決めるのが難しく、解読が止まってしまうことがある。そこでタリンさんは、文字の領域を決めずに、いきなり解読することを試みた。 この方法を使うと、AIは文章の段落や行などにとらわれず、見つけた文字からどんどん解読していくことがわかった。タリンさんの共同研究者で、カナダ・モントリオール大の大学院生アレックス・ラムさんは「すごく単純な考え方だったので、逆に誰もやろうとしなかった」と振り返る。  ただ、KuroNetにはまだ課題が残っている。これまでに学習に使った古典は、版木に彫られた文字を印刷した「版本」がほとんど。これらは専門の職人が書いた文字がもとになっており、文字の大きさなどのばらつきが少ない。 これに対し、日本各地に残る手書きの古文書などは、文字の大きさや墨の濃淡がそろっていないものが多いため、AIによる解読の精度が落ちる。  タリンさんは、「古文書は古典よりも数が多いうえ、専門家でも解読が難しい場合がある。ニーズの高い古文書解読の精度をあげるべく、研究を続けたい」と話す。手書きのくずし字のデータを、大量に学習させることなどを検討している。
次ページは:国内に存在する古典・古文書は数億点…新発見の宝庫として期待
https://headlines.yahoo.co.jp/hl?a=20191111-00010000-yom-sctch

政治・経済面で関連するブログを勝手に引用すると、

【国家戦略特区】公文書上から消える、不都合な事実(毛ば部とる子)https://kebabutoruko.com/20191109-moriyuko/

安倍首相による「桜を見る会」の公金を使った後援会(かっちの言い分)https://31634308.at.webry.info/201911/article_6.html

『世界』12月号に「武器見本市という憲法的不祥事(市民社会フォーラム)http://civilesociety.jugem.jp/?eid=40603

安倍首相「桜を見る会」の税金を使った不正が国会で明らかに!「地元… 赤かぶ(85)(阿修羅2019/11/10)http://www.asyura2.com/19/senkyo267/msg/245.html

何時もご支援有難うございます。少しでも広く読んでいただくために、以下のランキングに参加しています。

人気ブログランキングへ、

にほんブログ村 政治ブログ 政治・社会問題へ
にほんブログ村  何か感じましたらクリックお願い致します。

にほんブログ村 政治ブログへ
にほんブログ村  お手数ですがもう一度クリックお願いいたします。

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント