アカウント名:
パスワード:
この手のデジタルデータ化は日本企業以外も手がけているところ多数だと思いますが、わざわざ日本のNTTデータになったのはなぜなのでしょうね。今後の海外での文化財デジタルデータ化のビジネスを見越して、費用はNTTデータもちでも請け負うことに意義あり、とかそういった理由なんでしょうか。
それにしても、デジタル化後はオンラインで公開されると言っても、ラテン語とかギリシャ語だと一般人には読めないでしょうなあ。
ここでいう電子化が何を意味してるかで違ってくる。ただスキャナでデジタル写真化するだけなら、何が書かれてようが関係ない。効率と非破壊、品質くらいの差でしょう。書かれてる文字を起こす、というのはまた別問題で、NTTデータはそこまでできるんだろうか?OCRでも、現代の主要言語ならまだしも、手書き(筆記体)や古い言語だと不可能に近いと思う。
今回は、書籍の画像化技術というより、画像化されたアーカイヴデータの管理システムの方でしょうね。選択された理由ってのは。
プレスにも国内実績含めその事に触れてますし、そもそもシステム屋なんでしょうし。
そもそも日本のOCR技術って、筆記体の多い海外でどの程度のレベルなのか興味はありますけど。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家
なぜNTTデータ? (スコア:2)
この手のデジタルデータ化は日本企業以外も手がけているところ多数だと思いますが、わざわざ日本のNTTデータになったのはなぜなのでしょうね。今後の海外での文化財デジタルデータ化のビジネスを見越して、費用はNTTデータもちでも請け負うことに意義あり、とかそういった理由なんでしょうか。
それにしても、デジタル化後はオンラインで公開されると言っても、ラテン語とかギリシャ語だと一般人には読めないでしょうなあ。
Re: (スコア:0)
多様な文字種を扱う実績で言えば、日本の企業はその経験から一日の長があるのではないでしょうか。
母国語の範囲だけでも、漢字・ひらがな・カタカナ、縦書き・横書きなどバリエーションが多く、外国語を混ぜ書きすることも珍しくないですし。
多種多様な文字種を扱う点においては多少なりともアドバンテージはあるのではないか、という気がします。
Re: (スコア:0)
ここでいう電子化が何を意味してるかで違ってくる。
ただスキャナでデジタル写真化するだけなら、何が書かれてようが関係ない。効率と非破壊、品質くらいの差でしょう。
書かれてる文字を起こす、というのはまた別問題で、NTTデータはそこまでできるんだろうか?
OCRでも、現代の主要言語ならまだしも、手書き(筆記体)や古い言語だと不可能に近いと思う。
Re:なぜNTTデータ? (スコア:1)
今回は、書籍の画像化技術というより、画像化されたアーカイヴデータの管理システムの方でしょうね。
選択された理由ってのは。
プレスにも国内実績含めその事に触れてますし、そもそもシステム屋なんでしょうし。
そもそも日本のOCR技術って、筆記体の多い海外でどの程度のレベルなのか興味はありますけど。