パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

日本年金機構から入力業務を委託されていた業者、契約で禁止されていたにも関わらず中国の業者に再委託」記事へのコメント

  • なわけ無いと思うんですが...

    • Re: (スコア:5, 参考になる)

      by Anonymous Coward

      いや、あり得るよ。
      ここの業者がどうかはわからないけど、一般論の話として、外国でのデータ入力はこんな仕組みになってる。

      ●スキャンした文書を、ぶつ切り、バラバラにする
       ぶつ切り後OCRがかけられ、オペレータには候補として提示
      ●バラバラにした画像がランダムにオペレータには表示される。
       オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する
      ●できあがったバラバラのデータを機械的に再構築して入力データを生成する
       同じデータを複数人が入力する仕組みになっており、すりあわせて入力ミスのチェックが行われる
      ●ま

      • by Anonymous Coward

        > オペレータは文字の意味を理解すると言うより、同じ形の記号を選択する、といったイメージで入力する
         
        漢字を??
        IMEの手書き入力でも使ってるんでしょうか?

        • by Anonymous Coward

          業者が言うには、そうらしい。
          OCRである程度候補を絞っていて、表示されたなかから選択するのが基本だから、意味が分からない人でも作業ができて安くて安全です、とのこと。

          そっから先はどうしてるかはわからん。

          • それ系のシステムやってたんで補足~

            1. スキャンして画像化する

            2. あらかじめ帳票ごとに決められた入力対象場所(帳票上の座標と範囲)について
             ICRと呼ばれる文字認識をかける(単語辞書なども備えていて、文字じゃなく
             単語単位である程度の制度で認識をかけて文字データにしてくれる)

            3. 入力対象のある部分の帳票画像を切り出す(別の人が書いてた通り、画像としてカット)
             その時、必要に応じて個人情報などはマスクしたりする。
             (たとえばほぼ確実認識できる数字の口座情報などはマスクして隠したり)
             この部分の見せ方次第では、この後の作業担当者が見ても個人を特定しづらいようにしたりも
             可能(たとえば住所の一部しか見せない、とか)。

            4. エントリー/精査専門の担当者に次々と画像とICR処理時の候補と、打ち込みで書き換え可能な
             入力欄を表示。担当は次々と表示される画像に対して、正解を選択/入力していく。
             このあたりはワークフロー形式で、自分の工程に対して次々とデータが流れてくるのをひたすら処理する。

            5. 切り出した画像の元帳票に対応するデータに、エントリー/精査担当者の処理結果を反映する。

            こんな感じですかね。大量に処理するとわかるのだけど、結構無茶苦茶な字を書いてくる人とかいるので、
            帳票の記入欄のデザイン(はみ出しにくくしたり、ゆったり感を出したり、数字だと薄く下地に数字用の
            線を描いて誘導したり)が認識精度に影響したりします。

            あくまで一例ね。

            親コメント

※ただしPHPを除く -- あるAdmin

処理中...