アカウント名:
パスワード:
銀行業務の全てを知ってるわけではないですが、定型書類に書いてある数字なんて読み取ればいいのにと思う。
まだ精度の面で十分でないからOCRが実用レベルだと思っている人は試したことがないひと
つっても0~9の数字のみだよ。
+やーや桁区切りの,や小数点などあげればいろいろありますよましてやOCRでの読み込みなら様々な形に対応しなきゃなりません数字か数字出ないかの判断も必要ですよ
# '0'と'O'の判定なんてめんどくさいぞ
送金の金額欄に,はともかくO(まる)があったらそれはオーではなくゼロだし、±含めてそれ以外の文字や記号は全て弾けばいいじゃん。なんで汎用性を考えてんの?
> それ以外の文字や記号は全て弾けばいいじゃん。だからOCRでどうやってそれ以外かどうかって判断するのかって話単純な'1'だって書き方によっては7と読み間違えたりするんだけどね数字と思って書いた文字を認識できなくて読み飛ばしていたらそれこそ大問題だってわかってます?手書きなんだから(まる)がゼロとは限らないんですよ
>なんで汎用性を考えてんの?だって手書きの文字って汎用そのものですが
それでもiとかπを数字として認識する必要はないのでは?
そういうことでなく「絶対数字しか書かれない」という前提を置いて良いのでは?そうすれば一般的なOCRより簡単に作れるのでは?って言ってるんだと思う。多少妥当性はあるけど、その前提を置いても簡単じゃないよ(というか求められる精度が高いよ)ってのが現実だ、というのと伝票の数値欄に○が書かれてたからって数値とは限らないと思ってシステム組まなきゃなぁ、というのが世知辛い職人根性ではある。
それはそれとして、単独精度が最高級でなくともOCR読み取りと人間タイピングとをマッチングして精度を上げる、とかは可能と言えば可能。人間二人でダブルエントリーとかシングルエントリー+読み上げ検証とかと比較して時間とコストと精度が十分か、は議論の余地がある。……てか、同じ数字を二人が同時に読み間違えることは実際結構あるので、データ比較よりもその後の論理的検証(あり得る数値範囲から外れてないかとか)も重要なんだが。
>そういうことでなく「絶対数字しか書かれない」という前提を置いて良いのでは?手入力という時点でその前提は捨てました
#いやね、あのマスに漢字で書いたおばあちゃんが昔いたと聞いたことがあったので
銀行は最善を尽くして業務を執行する義務みたいなのがあったはずなので、漢数字で書かれても日本語として意味が通るなら、受け付けなければならないんじゃないかと思います
漢字ぐらい違えば流石にエラーで弾けるはじかれたら人がやれば良い数字も厳しめにしとけば良いんだよ1か7か自信が持てなきゃ弾け全部機械でやるコタ無い
他はいいんだけど>数字も厳しめにしとけば良いんだよ1か7か自信が持てなきゃ弾けこれやると「7」を2画で書かなきゃアウトというか一画目で下にチョイってのが無いと全部弾くハメになって、もんのすごく頻出する字にも関わらずOCRが「全部自信ねぇよ」って返してくることになるんスよ・・・。それよりは頻度低いけど6と0も同様(9は0よりも4との区別が難しい)。
いや、もちろん「できない」わけじゃない。安易に「厳しめにしとけばいいんだよ」って言えないよね、って話ね。
だから前提を捨てたと言っているのではないでしょうか
それ言い出したらOCR必要なくなってしまう
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
なんで銀行で手入力なんだろう (スコア:0)
銀行業務の全てを知ってるわけではないですが、
定型書類に書いてある数字なんて読み取ればいいのにと思う。
Re: (スコア:0)
まだ精度の面で十分でないから
OCRが実用レベルだと思っている人は試したことがないひと
Re: (スコア:0)
つっても0~9の数字のみだよ。
Re: (スコア:0)
+やーや桁区切りの,や小数点などあげればいろいろありますよ
ましてやOCRでの読み込みなら様々な形に対応しなきゃなりません
数字か数字出ないかの判断も必要ですよ
# '0'と'O'の判定なんてめんどくさいぞ
Re: (スコア:0)
送金の金額欄に,はともかくO(まる)があったらそれはオーではなくゼロだし、
±含めてそれ以外の文字や記号は全て弾けばいいじゃん。
なんで汎用性を考えてんの?
Re:なんで銀行で手入力なんだろう (スコア:0)
> それ以外の文字や記号は全て弾けばいいじゃん。
だからOCRでどうやってそれ以外かどうかって判断するのかって話
単純な'1'だって書き方によっては7と読み間違えたりするんだけどね
数字と思って書いた文字を認識できなくて読み飛ばしていたらそれこそ大問題だってわかってます?
手書きなんだから(まる)がゼロとは限らないんですよ
>なんで汎用性を考えてんの?
だって手書きの文字って汎用そのものですが
Re:なんで銀行で手入力なんだろう (スコア:1)
それでもiとかπを数字として認識する必要はないのでは?
Re: (スコア:0)
そういうことでなく「絶対数字しか書かれない」という前提を置いて良いのでは?そうすれば一般的なOCRより簡単に作れるのでは?
って言ってるんだと思う。
多少妥当性はあるけど、その前提を置いても簡単じゃないよ(というか求められる精度が高いよ)ってのが現実だ、というのと
伝票の数値欄に○が書かれてたからって数値とは限らないと思ってシステム組まなきゃなぁ、というのが世知辛い職人根性ではある。
それはそれとして、単独精度が最高級でなくともOCR読み取りと人間タイピングとをマッチングして精度を上げる、とかは可能と言えば可能。
人間二人でダブルエントリーとかシングルエントリー+読み上げ検証とかと比較して時間とコストと精度が十分か、は議論の余地がある。
……てか、同じ数字を二人が同時に読み間違えることは実際結構あるので、データ比較よりもその後の論理的検証(あり得る数値範囲から外れてないかとか)も重要なんだが。
Re: (スコア:0)
>そういうことでなく「絶対数字しか書かれない」という前提を置いて良いのでは?
手入力という時点でその前提は捨てました
#いやね、あのマスに漢字で書いたおばあちゃんが昔いたと聞いたことがあったので
Re: (スコア:0)
銀行は最善を尽くして業務を執行する義務みたいなのがあったはずなので、漢数字で書かれても日本語として意味が通るなら、受け付けなければならないんじゃないかと思います
Re: (スコア:0)
漢字ぐらい違えば流石にエラーで弾ける
はじかれたら人がやれば良い
数字も厳しめにしとけば良いんだよ1か7か自信が持てなきゃ弾け
全部機械でやるコタ無い
Re: (スコア:0)
他はいいんだけど
>数字も厳しめにしとけば良いんだよ1か7か自信が持てなきゃ弾け
これやると「7」を2画で書かなきゃアウトというか一画目で下にチョイってのが無いと全部弾くハメになって、
もんのすごく頻出する字にも関わらずOCRが「全部自信ねぇよ」って返してくることになるんスよ・・・。
それよりは頻度低いけど6と0も同様(9は0よりも4との区別が難しい)。
いや、もちろん「できない」わけじゃない。安易に「厳しめにしとけばいいんだよ」って言えないよね、って話ね。
Re: (スコア:0)
だから前提を捨てたと言っているのではないでしょうか
Re: (スコア:0)
それ言い出したらOCR必要なくなってしまう