いや、あり得るよ。
ここの業者がどうかはわからないけど、一般論の話として、外国でのデータ入力はこんな仕組みになってる。
●スキャンした文書を、ぶつ切り、バラバラにする
ぶつ切り後OCRがかけられ、オペレータには候補として提示
●バラバラにした画像がランダムにオペレータには表示される。
オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する
●できあがったバラバラのデータを機械的に再構築して入力データを生成する
同じデータを複数人が入力する仕組みになっており、すりあわせて入力ミスのチェックが行われる
●まとまったデータを機械的にチェックして行って情報訂正など
既存DBと突き合わせチェック、入力規則に反していないかとかはここでチェック
人件費が安いので複数人に入力させ機械的にできるのと、敢えて意味が分からないようにする事で思い込みでのミスを防止できるのだとか。
また、この方式だと日本語への理解はそんなに必要ないらしく、安い人材を使い回せるのだそう。
たぶん今だとディープラーニング系の技術でもうちょっと良くなっている可能性がある。
例えば入力結果をさらに教師データとしてぶち込んで、最後の機械的チェックをより自然にするとか、初期OCRの精度を上げるとか。
受注したがこなす能力のない業者が困って再委託した先は、この手の技術力がある会社だった、という可能性はある。
だとすると、結論としては
・国内で入力しろという制限を外す
・外国に出す場合は通常の配慮に加え、万が一でも個人情報にならない様に処理をさせる
・以上を定期的に監査する
って事じゃないかと。
で、このての入力作業は既に銀行屋・保険屋などが使ってるんで、技術的にはまず問題ない。
問題はそれらが適正に執行できているか監査をする能力があるかどうかの方だけど、それがありゃこんな問題にはなってないよな・・・。