アカウント名:
パスワード:
なわけ無いと思うんですが...
いや、あり得るよ。ここの業者がどうかはわからないけど、一般論の話として、外国でのデータ入力はこんな仕組みになってる。
●スキャンした文書を、ぶつ切り、バラバラにする ぶつ切り後OCRがかけられ、オペレータには候補として提示●バラバラにした画像がランダムにオペレータには表示される。 オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する●できあがったバラバラのデータを機械的に再構築して入力データを生成する 同じデータを複数人が入力する仕組みになっており、すりあわせて入力ミスのチェックが行われる●ま
> オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する 漢字を??IMEの手書き入力でも使ってるんでしょうか?
業者が言うには、そうらしい。OCRである程度候補を絞っていて、表示されたなかから選択するのが基本だから、意味が分からない人でも作業ができて安くて安全です、とのこと。
そっから先はどうしてるかはわからん。
それ系のシステムやってたんで補足~
1. スキャンして画像化する
2. あらかじめ帳票ごとに決められた入力対象場所(帳票上の座標と範囲)について ICRと呼ばれる文字認識をかける(単語辞書なども備えていて、文字じゃなく 単語単位である程度の制度で認識をかけて文字データにしてくれる)
3. 入力対象のある部分の帳票画像を切り出す(別の人が書いてた通り、画像としてカット) その時、必要に応じて個人情報などはマスクしたりする。 (たとえばほぼ確実認識できる数字の口座情報などはマスクして隠したり) この部分の見せ方次第では、この後の作業担当者が見ても個人を特定しづらいようにしたりも 可能(たとえば住所の一部しか見せない、とか)。
4. エントリー/精査専門の担当者に次々と画像とICR処理時の候補と、打ち込みで書き換え可能な 入力欄を表示。担当は次々と表示される画像に対して、正解を選択/入力していく。 このあたりはワークフロー形式で、自分の工程に対して次々とデータが流れてくるのをひたすら処理する。
5. 切り出した画像の元帳票に対応するデータに、エントリー/精査担当者の処理結果を反映する。
こんな感じですかね。大量に処理するとわかるのだけど、結構無茶苦茶な字を書いてくる人とかいるので、帳票の記入欄のデザイン(はみ出しにくくしたり、ゆったり感を出したり、数字だと薄く下地に数字用の線を描いて誘導したり)が認識精度に影響したりします。
あくまで一例ね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
中国の業者が行った作業には入力ミスなどは無かった (スコア:0)
なわけ無いと思うんですが...
Re: (スコア:5, 参考になる)
いや、あり得るよ。
ここの業者がどうかはわからないけど、一般論の話として、外国でのデータ入力はこんな仕組みになってる。
●スキャンした文書を、ぶつ切り、バラバラにする
ぶつ切り後OCRがかけられ、オペレータには候補として提示
●バラバラにした画像がランダムにオペレータには表示される。
オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する
●できあがったバラバラのデータを機械的に再構築して入力データを生成する
同じデータを複数人が入力する仕組みになっており、すりあわせて入力ミスのチェックが行われる
●ま
Re: (スコア:0)
> オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する
漢字を??
IMEの手書き入力でも使ってるんでしょうか?
Re: (スコア:0)
業者が言うには、そうらしい。
OCRである程度候補を絞っていて、表示されたなかから選択するのが基本だから、意味が分からない人でも作業ができて安くて安全です、とのこと。
そっから先はどうしてるかはわからん。
Re:中国の業者が行った作業には入力ミスなどは無かった (スコア:3, 興味深い)
それ系のシステムやってたんで補足~
1. スキャンして画像化する
2. あらかじめ帳票ごとに決められた入力対象場所(帳票上の座標と範囲)について
ICRと呼ばれる文字認識をかける(単語辞書なども備えていて、文字じゃなく
単語単位である程度の制度で認識をかけて文字データにしてくれる)
3. 入力対象のある部分の帳票画像を切り出す(別の人が書いてた通り、画像としてカット)
その時、必要に応じて個人情報などはマスクしたりする。
(たとえばほぼ確実認識できる数字の口座情報などはマスクして隠したり)
この部分の見せ方次第では、この後の作業担当者が見ても個人を特定しづらいようにしたりも
可能(たとえば住所の一部しか見せない、とか)。
4. エントリー/精査専門の担当者に次々と画像とICR処理時の候補と、打ち込みで書き換え可能な
入力欄を表示。担当は次々と表示される画像に対して、正解を選択/入力していく。
このあたりはワークフロー形式で、自分の工程に対して次々とデータが流れてくるのをひたすら処理する。
5. 切り出した画像の元帳票に対応するデータに、エントリー/精査担当者の処理結果を反映する。
こんな感じですかね。大量に処理するとわかるのだけど、結構無茶苦茶な字を書いてくる人とかいるので、
帳票の記入欄のデザイン(はみ出しにくくしたり、ゆったり感を出したり、数字だと薄く下地に数字用の
線を描いて誘導したり)が認識精度に影響したりします。
あくまで一例ね。