富士フイルム、画像化された文字をスマートフォンの画面サイズに合わせて改行するレイアウト再構築技術を開発 27
EPUB要らず? 部門より
富士フイルムが「画像化された文字をスマートフォンの画面サイズに合わせて改行するレイアウト再構築技術 」を開発したそうです。
スマートフォンは画面が小さく、また機種によって画面サイズがまちまちですので、かなり有用な機能ですね。個人用途でも自炊(スキャン)した書籍を観るときに便利なんじゃないかなーと思ったらすでに、Androidアプリ「GT-Document Lite for Dropbox 」としてリリースされており、Android Playから無料でダウンロードできます。
Dropboxに保存した自炊書籍を閲覧すると、確かに拡大縮小すると文章の各行を認識しました。なかなかの認識率です。文字認識ではなく画像として認識しているので、手書き文字でも対応できるとのこと。手書きではありませんが、低DPIでスキャンした(OCRは無理そうな)書籍もかなりの精度で再レイアウトできています。
実際の使用感ですが、文書を開いてから変換処理に少し時間(一瞬~10秒程度)がかかります(PDFの場合だけ?)。文章を拡大表示したくなったら、ダブルタップするとレイアウト改行モードになります。レイアウトの解析には2~3秒かかり、また1ページ分まるごと認識されるわけではなく、いくつかのブロックに分けて認識されます。
文章表示エリアは全体の5分の3程度で、ナビゲーター(画面全体レイアウト表示)が残りを占めます(ナビゲーターの表示はメニューからON/OFFできる)。ナビゲーター上の縮小表示された文書をタッチするとブロックを撰択できます。1ページ内のブロックの移動はすぐに行えました。
制限としては、現状横書き文書のみしか認識できない、最大10Mbyteのファイルまで(自炊書籍でページ数が多いと読める書籍が限られる)といったものがありました。
画像化・段落ブロック認識・行認識・文字要素認識・整形 (スコア:3)
英単語のスペースはともかく、日本語の単語内で区切られるので文字内容認識はしてないようです。
それでもグチャグチャなミミズっぽい手書き文字も一応文字境界で切れてるみたい。
FAXテンプレートのように部分ごとに段落ブロックがあると、タップすればそれぞれスマホ向けHTMLのように整形して表示してくれます。
あとはリアルタイムにスクロールできるならpdfの論文とかのリーダーになりうるかも。いまのところページ単位プレビュー支援といった程度かな。
#手動OCR補正ツールにこんな表示するやつがあったような
木亥火暴 (スコア:2)
糸吉女昏とか擬似倍角文字みたいのは分かれてしまうのでしょうね。
と、無駄な欠点指摘を考えてたら
部首と偏に分かれてしまうことはあるかもしれないなと思いました。
まぁうまいことやってるのかもしれないですし問題ないと思いますが。
Re:木亥火暴 (スコア:1)
スキャンとか元データの印刷精度とかにも依るけど、字の四隅にドットを打っておけば、プロポーショナルフォントだって正確に1文字づつ分割できそうだな。
……って、どこの誰が画像化リフローを前提にした印刷物を作るっていうんだ。
Re: (スコア:0)
AAもどうなるか楽しみだったり
Re: (スコア:0)
旭イ
ヒ成
となった時に、あの会社は怒るや否や
画面ちょっと怖い (スコア:1)
コロンブスの卵的な発想で感心した。すばらしい。
でも、デモンストレーションビデオをみてると、
処理後の画面が文章の途中で突然文字がぼやけたり、サイズが違ったり、段組がずれていたりして
ホラーゲームの画面を見ているような気分に襲われたw
>現状横書き文書のみしか認識できない
とは元記事にもあるけど、その記事のビデオの中で縦書き文章を認識するデモをしている不思議
Re: (スコア:0)
>現状横書き文書のみしか認識できない
とは元記事にもあるけど、その記事のビデオの中で縦書き文章を認識するデモをしている不思議
デモすら見てないが、90度傾けて処理してたりして?
Re: (スコア:0)
公開しているアプリは横書きにしか対応していないって事でしょう。
Re: (スコア:0)
背景が単色じゃない場合も、怖いことになりそうですね
Re: (スコア:0)
同じく商売のアイデアってどこにでも転がっているんだなと感心した。
これなら、富士フイルムのような大企業が開発しなくても、
情報系の大学生が数人集まるか、SOHO的に誰かが企画して人集めるかしても、
十分完成まで漕ぎつけられただろうと思う。
たとえばアメリカだったら、
この企画を思いついた人が、会社を辞めて自分でベンチャー企業を始めてしまうのではないかな。
だって技術の重要性のわりに、技術的なハードルが低いもの。
Re: (スコア:0)
縦書きがデモのみなのは、おそらくルビの分離対応がまだなんだろうと思う。
例えばMeTilTranもルビが鬼門で、本文にルビを巻き込んで分離がうまくいかなかったりしてる。
とくに最近のラノベとかだと、本文の80%にルビがついてることもザラだったりw
MeTilTran (スコア:1)
http://no722.cocolog-nifty.com/blog/metiltran/index.html [cocolog-nifty.com]
と似た話?
Re:MeTilTran (スコア:1)
どっかでみたと思った。
by rti.
Re:MeTilTran (スコア:1)
Re:MeTilTran (スコア:1)
意外とありますよ。Firebugとか。
無限進数の各桁を10進表記してるイメージなんでしょう。
Re:MeTilTran (スコア:1)
0.8.0と0.1.0や0.1.1ならばその通りですけど、0.8.0と0.10.0または0.11.0ならば、特に違和感は感じませんが…。
Yasuda
Re: (スコア:0)
この(.)記号を単なる区切り記号としてみれば何の違和感もないんだけど、数字と数字の間に挟まれると小数点にしか見えないので
Re: (スコア:0)
Linux kernelのバージョンとか馴染みないですか。
Re: (スコア:0)
普通。
Re:MeTilTran (スコア:1)
文字を画像のまま扱いつつ再レイアウトするというアイディアは既にMeTilTran [cocolog-nifty.com]で実現されていいるじゃねーか、…と思いつつ動画 [diginfo.tv]を見たら、予想をはるかに超えたサクサクした動作と強力な認識でびっくり。その場で拡大縮小できるのは、変換ソフトではなくビューアであるが故の利点ですね。
また、カメラのある携帯端末で動かすので、紙に印刷された文章をその場で取り込んで扱えるのがいいです。拡大読書器 [google.co.jp]として、そんじょそこらの馬鹿高い専用機よりも使い勝手がいいかも。
#もっとも、Android端末の汎用性ゆえの使いにくさを専用ランチャなどで補う必要はあるでしょうが。また、ソフト内のUIは、拡大読書器を必要とする方は別の拡大器を必要とする悪寒。
Re: (スコア:0)
私もそれ思った。作者があまり興味持ってないのかアップデートされてないんだけど、あまり知られてないのかな?
著作権的に問題あり! (スコア:1)
作者の意図に反して改行したら縦読みが出来なくなるじゃなイカ!
もしかして (スコア:0)
BREADER
Re: (スコア:0)
活版のこと?
Re:確か・・・ (スコア:1, おもしろおかしい)
Re: (スコア:0)
みななつかんこく