Re:その前に (#3616957) | Universal Dependencies 2.4がリリース

「Universal Dependencies 2.4がリリース」記事へのコメント

記事ページを表示すべてのコメント取得

検索29コメント Log In/Create an Account

その前に (スコア:1)

by Anonymous Coward

> 係り受け解析や文法解析に、どしどし使ってほしい
他分野のことはよくわからんが、日本の古い文書を読むことが多い者として…
文法解析以前に、文書のデジタル化がまったく未整備なんだよねぇ。「国立国会図書館デジタルコレクション [ndl.go.jp]」だって、デジタルとは名ばかりで、中身は印影のデータ化まで。
いろんな分野で翻刻プロジェクトはあるんだが、媒体が紙止まりなんだよねぇ。もっとも先進的な翻刻プロジェクトである「歌舞伎評判記集成 [izumipb.co.jp]」は、内部では文字データ化して翻刻者間のやりとりをしているはずなのに、成果は紙でしか出さないみたいだし。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  文字化はAI OCRが古文書の自動判読精度を実用レベルまで向上しない限りそのままなのだと思う。
  - Re:その前に (スコア:0)
    
    by Anonymous Coward on 2019年05月18日 19時28分 (#3616957)
    
    それこそ機械学習を活用できる分野だと思うのですが、機械学習を勉強するときが来たらちょっとやってみようかな
    
    シェア
    
    親コメント
    - Re:その前に (スコア:1)
      
      by Anonymous Coward on 2019年05月18日 21時08分 (#3616983)
      
      正解率だけでいえば、OCRは既に人間を超えているかもしれない。
      OCRが実用になっていないのはfalse positiveに対する要求の厳しさだと思う。
      たった一つの誤字でストーリー全体が台無しになるのは、スラド民なら理解できると思う。
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        >たった一つの誤字でストーリー全体が台無しになるのは、スラド民なら理解できると思う。
        hylom式AI「誤字？だからなに？」
        みんなhylomをちょっとは見習えよな！
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        hylom式AI「誤字？足しといてあげたよ」

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Universal Dependencies 2.4がリリース More ログイン

「Universal Dependencies 2.4がリリース」記事へのコメント

その前に (スコア:1)

Re: (スコア:0)

Re:その前に (スコア:0)

Re:その前に (スコア:1)

Re: (スコア:0)

Re: (スコア:0)