アカウント名:
パスワード:
我々が必要としているのは、そのまま処理可能な電子化されたデータであって電子化と称してただ単にスキャンしただけの画像ファイルではない
(画像ファイルをOCRかけてデータを抜き出することがどれだけ大変か・・・)(ましてやこの場合扱うモノがお金、間違いは許されない)
履き違えてはいない。処理可能化するのは更にその次にやればいい。すでにスキャンされていれば処理しやすいだろう。重要なのはまず紙をなくせば倉庫代を削減できること。その浮いたお金で次の手を打ってもいいはずだ。
そうはいっても、そのファイルが何のファイルかは入力しておかないと後で探すこともできないし、正直、現存のものは適当な年数たったら廃棄、これからのは電子化とするのが合理的なような気もするんだけど。
メタデータをつけておけばマスデータはあとでいいでしょ。
口座開設時の書類みたいなものは、口座が残っている限り適当な年数で破棄なんてさすがに無理では。最悪倉庫にしまってあったのと同じ規則で分類しといて、自炊本をめくる感覚で中身を確認でもよい。三菱UFJともなるとそんな手抜きはないと思うが、書類に物理的にアクセスしなくてよくなるだけでも便利になりそう。
そんな書類含んでたら3億枚じゃ済むまい。
30年前にやったなあ→取り敢えずの電子化と簡単なキーワード付け。元がダメダメなので取っててもね…で大半は捨てた。
今までやってなかったのね…
契約書みたいな確認にしか使わない奴ってそれだけで済むんだよね。確認したいときに引っ張り出す算段さえあればよいのだから。ただ、電子化しても大抵は破棄は出来ないけども。
>すでにスキャンされていれば処理しやすいだろう。
んなこたーない1つのウインドウ上で画像みながら入力するより、紙の書類を見ながら入力したほうが効率良い照らし合わせもウインドウに縛られないから簡単にできるしね
電子化というか、在庫整理でしょ。
既に紙になった物を今から嘆いても手遅れ。OCRすらその解決策にはなりえない。
紙のままで困って無かった書類なら、OCRもかけずイメージデータのままでもしばらくは問題ないだろう。キッチリと電子データ化するのなら、再度その情報を使用する時に電子化する工程を入れれば良いだけの話。
保存してある書類って、内規で保存する事になっているとか、法律上保存が義務付けられているなんて書類じゃないでしょうかね。新しいデータは電子化されてるけど、古い書類は紙媒体で保存してるんでそれを電子化するって感じじゃないかと。金融機関の通帳データなんかは、以前はマイクロフィルムで保存してましたけど、最近じゃさすがに電子化してるんでしょうね。
倉庫に放り込まれてるような書類なんだから、「なんかあった時のために確認する」程度の紙なんだろう
関係省庁にFAXできりゃ十分だよえ?はんこ?
そんなレベルじゃねぇ。
>届け出印の印影と署名は専用端末でみられるが、それ以外の内容は現物がある遠隔地の倉庫で確かめなければならず、問い合わせは毎日数百件にのぼる。
元コメもだがリンクぐらい読めばいいのに。単にスキャンしただけの画像ファイルを窓口で確認できるだけでも効果があるのは分かると思う。リアルでもその調子で人の話を聞かずにおれの妄想した最強の方法になってないから糞とかやってんのかな。
分母がよく分からないのだけど、「現物がある遠隔地の倉庫」がひとつ(つまり全国の三菱UFJ銀行からの問い合わせ合計が毎日数百件)だけなら割と「なんかあった時のために確認する」程度と言っても良い気がする。
元コメの文意が「なんかあった時に確認できる程度の画質なら十分だよ」辺りの可能性
デカい銀行なんだから、「なんかあった時」が1日数百件しかないって話じゃない?
各支店でだいたい毎日1回ある「なんかあった時」は、おれがイメージした「なんかあった時」とはなんか違う気がする…。
サポートとか想像出来たら、他者の「なんかあった時」が担当では「毎日沢山来る業務」と成り得ると理解できると思うんだ。
彼らが必要としてるのは、そのまま視認可能な電子化された押印であって電子化と称してただ単にExcel化しただけのOfficeファイルではない
紙から探すよりは楽だろ…物理的な問題の解決が何よりのメリットだし。
>(画像ファイルをOCRかけてデータを抜き出することがどれだけ大変か・・・)一般的なのかどうかまでは知らんけど、会社に置いてある複合機(キヤノンとゼロックス混在)どれでスキャンしてもデフォルトの出力ファイルはPDFで、OCR処理されて文字の位置にオーバーラップして透明なテキストが埋め込まれたやつが出てきてます。実際、そのPDFからテキストを吸い上げて検索に利用しています。書類のタイトル等をAIで拾えるならほとんど手間はかからないような。(うちはその辺は人力)
# OCRで完全な文章を拾おうとすると大変だろうけど重要なキーワードは文中に何度も出てくるので# どれか1回でも正確に拾えていればキーワード検索には使える、というような考えで使っています。
そのまま処理可能な電子化されたデータ
ドキュメントではない。
おお、これは失礼。その前提ならOCRには全く現実味がありませんね。もしそれを本気でやろうとしたなら確かに元コメの通り。
元記事の方は「紙の書類」とか「ホチキス留め」とかいう表現出てるから伝票のようなものは想定していないものかと。何某かの入力データとして数値なんかを利用するような想定だとAI使ってもおそらく厳しいでしょうね。
個人の口座開設時などに記入する印鑑票と呼ぶ書類を電子化する。過去の詳しい取引内容や本人確認の資料も含む。
文書があってそれを読むための電子化なら#3860080レベルで充分だけど、#3859942は申込書や取引依頼書などのOCRを業務に組み込む理想の電子化の話をしていると思われる。「紙の書類」や「ホチキス留め」とあっても、同じ種類の文書だけでなく関連文書をまとめることもあるので伝票が含まれていてもおかしくないかな。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
電子化を履き違えてる (スコア:1)
我々が必要としているのは、そのまま処理可能な電子化されたデータであって
電子化と称してただ単にスキャンしただけの画像ファイルではない
(画像ファイルをOCRかけてデータを抜き出することがどれだけ大変か・・・)
(ましてやこの場合扱うモノがお金、間違いは許されない)
Re:電子化を履き違えてる (スコア:2, すばらしい洞察)
履き違えてはいない。処理可能化するのは更にその次にやればいい。
すでにスキャンされていれば処理しやすいだろう。
重要なのはまず紙をなくせば倉庫代を削減できること。その浮いたお金で次の手を打ってもいいはずだ。
Re: (スコア:0)
そうはいっても、そのファイルが何のファイルかは入力しておかないと
後で探すこともできないし、正直、現存のものは適当な年数たったら廃棄、
これからのは電子化とするのが合理的なような気もするんだけど。
Re: (スコア:0)
メタデータをつけておけばマスデータはあとでいいでしょ。
Re: (スコア:0)
口座開設時の書類みたいなものは、口座が残っている限り適当な年数で破棄なんてさすがに無理では。
最悪倉庫にしまってあったのと同じ規則で分類しといて、自炊本をめくる感覚で中身を確認でもよい。
三菱UFJともなるとそんな手抜きはないと思うが、書類に物理的にアクセスしなくてよくなるだけでも便利になりそう。
Re: (スコア:0)
そんな書類含んでたら3億枚じゃ済むまい。
Re: (スコア:0)
30年前にやったなあ→取り敢えずの電子化と簡単なキーワード付け。
元がダメダメなので取っててもね…で大半は捨てた。
今までやってなかったのね…
Re: (スコア:0)
契約書みたいな確認にしか使わない奴ってそれだけで済むんだよね。
確認したいときに引っ張り出す算段さえあればよいのだから。
ただ、電子化しても大抵は破棄は出来ないけども。
Re: (スコア:0)
>すでにスキャンされていれば処理しやすいだろう。
んなこたーない
1つのウインドウ上で画像みながら入力するより、紙の書類を見ながら入力したほうが効率良い
照らし合わせもウインドウに縛られないから簡単にできるしね
Re: (スコア:0)
電子化というか、在庫整理でしょ。
既に紙になった物を今から嘆いても手遅れ。
OCRすらその解決策にはなりえない。
Re: (スコア:0)
紙のままで困って無かった書類なら、OCRもかけずイメージデータのままでもしばらくは問題ないだろう。
キッチリと電子データ化するのなら、再度その情報を使用する時に電子化する工程を入れれば良いだけの話。
Re: (スコア:0)
保存してある書類って、内規で保存する事になっているとか、法律上保存が義務付けられているなんて書類じゃないでしょうかね。
新しいデータは電子化されてるけど、古い書類は紙媒体で保存してるんでそれを電子化するって感じじゃないかと。
金融機関の通帳データなんかは、以前はマイクロフィルムで保存してましたけど、最近じゃさすがに電子化してるんでしょうね。
Re: (スコア:0)
倉庫に放り込まれてるような書類なんだから、
「なんかあった時のために確認する」程度の紙なんだろう
関係省庁にFAXできりゃ十分だよ
え?はんこ?
Re: (スコア:0)
そんなレベルじゃねぇ。
>届け出印の印影と署名は専用端末でみられるが、それ以外の内容は現物がある遠隔地の倉庫で確かめなければならず、問い合わせは毎日数百件にのぼる。
元コメもだがリンクぐらい読めばいいのに。
単にスキャンしただけの画像ファイルを窓口で確認できるだけでも効果があるのは分かると思う。
リアルでもその調子で人の話を聞かずにおれの妄想した最強の方法になってないから糞とかやってんのかな。
Re:電子化を履き違えてる (スコア:2)
分母がよく分からないのだけど、「現物がある遠隔地の倉庫」がひとつ(つまり全国の三菱UFJ銀行からの問い合わせ合計が毎日数百件)だけなら割と「なんかあった時のために確認する」程度と言っても良い気がする。
Re: (スコア:0)
元コメの文意が「なんかあった時に確認できる程度の画質なら十分だよ」辺りの可能性
Re: (スコア:0)
デカい銀行なんだから、「なんかあった時」が1日数百件しかないって話じゃない?
Re: (スコア:0)
各支店でだいたい毎日1回ある「なんかあった時」は、おれがイメージした「なんかあった時」とはなんか違う気がする…。
Re: (スコア:0)
サポートとか想像出来たら、他者の「なんかあった時」が担当では「毎日沢山来る業務」と成り得ると理解できると思うんだ。
Re: (スコア:0)
彼らが必要としてるのは、そのまま視認可能な電子化された押印であって
電子化と称してただ単にExcel化しただけのOfficeファイルではない
Re: (スコア:0)
紙から探すよりは楽だろ…
物理的な問題の解決が何よりのメリットだし。
Re: (スコア:0)
>(画像ファイルをOCRかけてデータを抜き出することがどれだけ大変か・・・)
一般的なのかどうかまでは知らんけど、会社に置いてある複合機(キヤノンとゼロックス混在)どれでスキャンしてもデフォルトの出力ファイルはPDFで、OCR処理されて文字の位置にオーバーラップして透明なテキストが埋め込まれたやつが出てきてます。実際、そのPDFからテキストを吸い上げて検索に利用しています。
書類のタイトル等をAIで拾えるならほとんど手間はかからないような。(うちはその辺は人力)
# OCRで完全な文章を拾おうとすると大変だろうけど重要なキーワードは文中に何度も出てくるので
# どれか1回でも正確に拾えていればキーワード検索には使える、というような考えで使っています。
Re: (スコア:0)
そのまま処理可能な電子化されたデータ
ドキュメントではない。
Re: (スコア:0)
おお、これは失礼。
その前提ならOCRには全く現実味がありませんね。
もしそれを本気でやろうとしたなら確かに元コメの通り。
元記事の方は「紙の書類」とか「ホチキス留め」とかいう表現出てるから伝票のようなものは想定していないものかと。
何某かの入力データとして数値なんかを利用するような想定だとAI使ってもおそらく厳しいでしょうね。
Re: (スコア:0)
個人の口座開設時などに記入する印鑑票と呼ぶ書類を電子化する。過去の詳しい取引内容や本人確認の資料も含む。
文書があってそれを読むための電子化なら#3860080レベルで充分だけど、#3859942は申込書や取引依頼書などのOCRを業務に組み込む理想の電子化の話をしていると思われる。
「紙の書類」や「ホチキス留め」とあっても、同じ種類の文書だけでなく関連文書をまとめることもあるので伝票が含まれていてもおかしくないかな。