パスワードを忘れた? アカウント作成
5108534 story
書籍

富士フイルム、画像化された文字をスマートフォンの画面サイズに合わせて改行するレイアウト再構築技術を開発 27

ストーリー by hylom
EPUB要らず? 部門より
fslasht 曰く、

富士フイルムが「画像化された文字をスマートフォンの画面サイズに合わせて改行するレイアウト再構築技術 」を開発したそうです。

スマートフォンは画面が小さく、また機種によって画面サイズがまちまちですので、かなり有用な機能ですね。個人用途でも自炊(スキャン)した書籍を観るときに便利なんじゃないかなーと思ったらすでに、Androidアプリ「GT-Document Lite for Dropbox 」としてリリースされており、Android Playから無料でダウンロードできます。

Dropboxに保存した自炊書籍を閲覧すると、確かに拡大縮小すると文章の各行を認識しました。なかなかの認識率です。文字認識ではなく画像として認識しているので、手書き文字でも対応できるとのこと。手書きではありませんが、低DPIでスキャンした(OCRは無理そうな)書籍もかなりの精度で再レイアウトできています。

実際の使用感ですが、文書を開いてから変換処理に少し時間(一瞬~10秒程度)がかかります(PDFの場合だけ?)。文章を拡大表示したくなったら、ダブルタップするとレイアウト改行モードになります。レイアウトの解析には2~3秒かかり、また1ページ分まるごと認識されるわけではなく、いくつかのブロックに分けて認識されます。

文章表示エリアは全体の5分の3程度で、ナビゲーター(画面全体レイアウト表示)が残りを占めます(ナビゲーターの表示はメニューからON/OFFできる)。ナビゲーター上の縮小表示された文書をタッチするとブロックを撰択できます。1ページ内のブロックの移動はすぐに行えました。

制限としては、現状横書き文書のみしか認識できない、最大10Mbyteのファイルまで(自炊書籍でページ数が多いと読める書籍が限られる)といったものがありました。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 英単語のスペースはともかく、日本語の単語内で区切られるので文字内容認識はしてないようです。
    それでもグチャグチャなミミズっぽい手書き文字も一応文字境界で切れてるみたい。

    FAXテンプレートのように部分ごとに段落ブロックがあると、タップすればそれぞれスマホ向けHTMLのように整形して表示してくれます。
    あとはリアルタイムにスクロールできるならpdfの論文とかのリーダーになりうるかも。いまのところページ単位プレビュー支援といった程度かな。

    #手動OCR補正ツールにこんな表示するやつがあったような

  • by kcg (26566) on 2012年07月12日 7時43分 (#2191782) ホームページ 日記

    糸吉女昏とか擬似倍角文字みたいのは分かれてしまうのでしょうね。

    と、無駄な欠点指摘を考えてたら
    部首と偏に分かれてしまうことはあるかもしれないなと思いました。

    まぁうまいことやってるのかもしれないですし問題ないと思いますが。

    • その辺はOCRでノウハウを積んでるでしょう。

      スキャンとか元データの印刷精度とかにも依るけど、字の四隅にドットを打っておけば、プロポーショナルフォントだって正確に1文字づつ分割できそうだな。
      ……って、どこの誰が画像化リフローを前提にした印刷物を作るっていうんだ。
      親コメント
    • by Anonymous Coward

      AAもどうなるか楽しみだったり

    • by Anonymous Coward

      旭イ
      ヒ成

      となった時に、あの会社は怒るや否や

  • by Anonymous Coward on 2012年07月12日 6時18分 (#2191773)

    コロンブスの卵的な発想で感心した。すばらしい。

    でも、デモンストレーションビデオをみてると、
    処理後の画面が文章の途中で突然文字がぼやけたり、サイズが違ったり、段組がずれていたりして
    ホラーゲームの画面を見ているような気分に襲われたw

    >現状横書き文書のみしか認識できない

    とは元記事にもあるけど、その記事のビデオの中で縦書き文章を認識するデモをしている不思議

    • by Anonymous Coward

      >現状横書き文書のみしか認識できない

      とは元記事にもあるけど、その記事のビデオの中で縦書き文章を認識するデモをしている不思議

      デモすら見てないが、90度傾けて処理してたりして?

    • by Anonymous Coward

      公開しているアプリは横書きにしか対応していないって事でしょう。

    • by Anonymous Coward

      でも、デモンストレーションビデオをみてると、
      処理後の画面が文章の途中で突然文字がぼやけたり、サイズが違ったり、段組がずれていたりして
      ホラーゲームの画面を見ているような気分に襲われたw

      背景が単色じゃない場合も、怖いことになりそうですね

    • by Anonymous Coward

      同じく商売のアイデアってどこにでも転がっているんだなと感心した。

      これなら、富士フイルムのような大企業が開発しなくても、
      情報系の大学生が数人集まるか、SOHO的に誰かが企画して人集めるかしても、
      十分完成まで漕ぎつけられただろうと思う。
      たとえばアメリカだったら、
      この企画を思いついた人が、会社を辞めて自分でベンチャー企業を始めてしまうのではないかな。

      だって技術の重要性のわりに、技術的なハードルが低いもの。

    • by Anonymous Coward

      縦書きがデモのみなのは、おそらくルビの分離対応がまだなんだろうと思う。
      例えばMeTilTranもルビが鬼門で、本文にルビを巻き込んで分離がうまくいかなかったりしてる。
      とくに最近のラノベとかだと、本文の80%にルビがついてることもザラだったりw

  • by Anonymous Coward on 2012年07月12日 9時26分 (#2191821)
    • by rti (659) on 2012年07月12日 11時46分 (#2191913) ホームページ

      どっかでみたと思った。

      --
      by rti.
      親コメント
    • by adeu (2937) on 2012年07月12日 12時16分 (#2191927)
      0.8βよりも0.10βや0.11βのほうが新しいというバージョン番号体系は初めて見ました
      親コメント
      • by minet (45149) on 2012年07月12日 12時25分 (#2191934) 日記

        意外とありますよ。Firebugとか。
        無限進数の各桁を10進表記してるイメージなんでしょう。

        親コメント
      • by Yasuda (8123) on 2012年07月12日 12時27分 (#2191938) 日記

        0.8.0と0.1.0や0.1.1ならばその通りですけど、0.8.0と0.10.0または0.11.0ならば、特に違和感は感じませんが…。

        --
        Yasuda
        親コメント
        • by Anonymous Coward

          この(.)記号を単なる区切り記号としてみれば何の違和感もないんだけど、数字と数字の間に挟まれると小数点にしか見えないので

          • by Anonymous Coward

            Linux kernelのバージョンとか馴染みないですか。

      • by Anonymous Coward

        普通。

    •  文字を画像のまま扱いつつ再レイアウトするというアイディアは既にMeTilTran [cocolog-nifty.com]で実現されていいるじゃねーか、…と思いつつ動画 [diginfo.tv]を見たら、予想をはるかに超えたサクサクした動作と強力な認識でびっくり。その場で拡大縮小できるのは、変換ソフトではなくビューアであるが故の利点ですね。

       また、カメラのある携帯端末で動かすので、紙に印刷された文章をその場で取り込んで扱えるのがいいです。拡大読書器 [google.co.jp]として、そんじょそこらの馬鹿高い専用機よりも使い勝手がいいかも。
      #もっとも、Android端末の汎用性ゆえの使いにくさを専用ランチャなどで補う必要はあるでしょうが。また、ソフト内のUIは、拡大読書器を必要とする方は別の拡大器を必要とする悪寒。

      親コメント
    • by Anonymous Coward

      私もそれ思った。作者があまり興味持ってないのかアップデートされてないんだけど、あまり知られてないのかな?

  • by Anonymous Coward on 2012年07月12日 9時58分 (#2191846)

    作者の意図に反して改行したら縦読みが出来なくなるじゃなイカ!

  • by Anonymous Coward on 2012年07月12日 9時00分 (#2191809)

    BREADER

typodupeerror

にわかな奴ほど語りたがる -- あるハッカー

読み込み中...