富士通研、人手による校正履歴を用いた日本語自動校正技術を発表 38
ストーリー by reo
むしろ僕が欲しい 部門より
むしろ僕が欲しい 部門より
apt 曰く、
富士通研究所は、人が校正した文章の履歴を使って文章校正を自動的に行う技術を開発したそうだ (富士通研究所のプレスリリース、クラウド Watch の記事より) 。
近年、中国を中心にオフショア開発が増加しているが、外国人にとって日本語の執筆は難しく、「て」「に」「を」「は」などの助詞の誤り、用語の使い方の誤りなどがしばしば発生する。これを校正する日本人担当者の仕事を代替し、外国人執筆者が効率的に校正できるシステムが求められていた。そこで、過去の校正履歴を用いて似たような誤りを自動で検出、修正する技術を開発したとのこと。
昨日、Lenovo IdeaPad のマニュアルの日本語がひどいというストーリー (/.J 記事) が掲載されていたが、こういう技術を使えば少しはマシなマニュアルを書けるようになるのだろうか。
トピックのタイトル (スコア:4, おもしろおかしい)
「日本語自動構成技術」って…。
この技術を使えば、スラドもちゃんと校正してもらえるかもしれませんね。
Re:トピックのタイトル (スコア:2)
修正しました。ご指摘 thx です。
# 部門名とタイアップした高度なエスプリなんですよ (ということにしておいてください) 。
Hiroki (REO) Kashiwazaki
Re:トピックのタイトル (スコア:1)
あちゃー。やってしまいました。ごめんなさい。
訂正よろしくお願いします。>編集者様
言い訳をすると、「自動構成」に引っ張られてIMEが変換してしまったのを見逃したのでしょう
Re: (スコア:0)
コピペすればいいのに何故手打ちしてわざわざ間違えるんだろ
Re: (スコア:0)
きっと、文章中に同じ単語が出てきたかどうかを全て記憶しておいて、それを文章中から探し出して、コピーしてペーストする手間を惜しんだのでしょう。
どうしてそういうことになったのかは、良い表現や文の流れなどをいろいろ推敲しながら文章を書くことを想像してみればわかるんじゃないかと思います。
# それとも単語の切り貼りの手間を惜しまないことで変換ミスを無くせば、こんな自動校正のシステムは要らないだろうっていう高度なネタ?
そしてそれがちゃんと機能しているか最後は人間が・・・ (スコア:2)
というオチだったら笑えるんだけど、意外とそうでもないので笑えない。
Re:そしてそれがちゃんと機能しているか最後は人間が・・・ (スコア:1)
というオチだったら笑えるんだけど、意外とそうでもないので笑えない。
でも、常が正しい答えの何かというフィードバックと必要ですよね。
日本語へ変わったいってくるますから。
# 文章崩すって意外と難しい
# チェックする箇所が減るだけでも最終工程の人間の作業は楽になると思いますよ
Re: (スコア:0)
間違いが少なくなると、間違いがあってもスルーしてしまう可能性が上がったりしないのかな。
ケンブリッジ大学の研究だっけ?多少の間違いは気にならないってやつ。
Re:そしてそれがちゃんと機能しているか最後は人間が・・・ (スコア:1)
そうそう、おかげで「ウコン」とか「おこめ券」とか見るたんびに、なにやら気恥ずかしい思いをします。
Re:そしてそれがちゃんと機能しているか最後は人間が・・・ (スコア:1)
まがちい とういか、たんご の さいしょ と さいご の もじが あれってば なとなんく
よちゃめうって やつ。
かんにんぜでらむだめとたり。
スルースキル:Lv2
Keep It Simple, Stupid!
Re: (スコア:0)
校正した履歴を元に自動的に校正する仕組みなのだから、そりゃ最後は人間が内容を確認して校正するサイクルになるでしょうね。
Re:そしてそれがちゃんと機能しているか最後は人間が・・・ (スコア:1)
完全に任せるのではなく「効率アップ」ですからね、目標が。
wordの校正機能だってここまでの能力は無いですけど、日本人が日本語書く時に使ってみても結構ミスが拾える。
こういう方向性の研究はどんどん進んで欲しいモノです。
・・・一つ間違えると○○語フィルターみたいなものができあがるかも知れませんが。(語尾に「にゃ」とか「ですぅ」とか付けないと怒られる)
校正履歴がアレで (スコア:2)
Re:校正履歴がアレで (スコア:1)
「まん真ん中」は東京弁、「ど真ん中」は大阪弁ですね。
# いやま、どちらがいいとかじゃなく、事実として。
Re:校正履歴がアレで (スコア:3)
Re:校正履歴がアレで (スコア:1)
# 「まん真ん中」が東京弁というのは確か漫才の内海桂子師匠が指摘してました。
# 「東京の芸人がど真ん中なんて言っちゃいけません。」って。
Re:校正履歴がアレで (スコア:1)
Re: (スコア:0)
そういえば観音様って隠語だよね・・・
Re: (スコア:0)
#おばあちゃん(関西人)が教えてくた。
Re:校正履歴がアレで (スコア:1)
Re: (スコア:0)
その元ネタでは?
関西と言っても広いので「まんまんちゃん、あん」もあれば「のんのんさん、あん」もある。
#東京だと「なむなむさん」かな?
Re:校正履歴がアレで (スコア:1)
Engrish校正 (スコア:2)
Re:Engrish校正 (スコア:1)
MAS(Man Aided Translation) System とか言うのかな。
Re: (スコア:0)
Translation Assists System で中の人からはTASさんと呼ばれる(´・ω・`)
Re: (スコア:0)
TASさんを使った翻訳は人手の翻訳と区別できるようにしろとかいう空気に満ちあふれるのですね。
最初の使用例は (スコア:1)
この技術を搭載した製品のマニュアルは、当然その製品によって校正されるんだろうね?
#それでも誤字が見つかった時は「当技術を使用した証明です」と言えばよろしい。
最後は楽になるのでしょうが (スコア:1)
そうなるまで、「日本人校正者」が、
文章を校正する手間&システム入力する手間
がかかるんでなければ良いのですが。
そして、担当者が入力する手間を忌避してシステムがいっこうに完成しない落ち。
あれ? (スコア:1)
これ [justsystems.com]は?
「外国人が書いた(ちょっと不自然な)日本語」を校正支援する、ってところがミソなのかしら。
はじける加齢の香り!orz
Re:あれ? (スコア:2)
プレスリリースより引用:
この製品の売りは、あらかじめ辞書を用意することはせず、校正履歴との類似度だけで判定するところです。専用辞書を作成する必要はなく、単語の組み合わせが違っていても応用が効きます。プレスリリースでは、「冬は雪を降ります」→「冬には雪が降ります」という校正履歴があれば上記の例を「梅雨には雨が降ります」と校正できると説明しています。
ただこのシステムは、構文を見ているだけで意味はチェックしませんから、「梅雨は雪を降ります」とあった場合、「梅雨には雪が降ります」に直して校正済みになります。文脈を読んだり筆者に問い合わせるなどして、「冬には雪が振ります」「梅雨には雨が振ります」あるいは「梅雨には雪は降りません」と直すような校閲作業はできません。
また、類似した校正履歴がないタイプの誤記は修正できません。しっかりした校正担当者が校正履歴に付け加えることで初めて対処できるようになります。
というのはちょっと盛り過ぎで、単純な誤記を下校正しておくことで校正担当者の負担を軽減させるという使い方が適切でしょう。
Re:あれ? (スコア:1)
ここにまとめてレスしちゃいますが。
なるほどなるほど、解説ありがとうございます。
キモは「日本話者が書いた表現の揺れを直す」と「非日本語話者の文法上の誤りを直す」
ってところに違いがあるんですね。
ということは、多段で通すとより綺麗な日本語になるんですかね?とか素人考えでしょうか。
あと、レスにもありますが校正履歴に残す人には綺麗な日本語へ直せるような技術が確実に
要りますね。
IT関連の方(営業さんも技術屋さんも)の不思議な日本語を(特にメールで)結構
目にすることがあるんで。
# 「~の確認をお願いします。以上よろしくお願いします」と「お願いします」が多段に
# なってたり。
はじける加齢の香り!orz
Re: (スコア:0)
「降ります」と「振ります」が気になる……
#あげあしなんどえAC
Re:あれ? (スコア:1)
同じく。そういう使い方もあるというトラップなのかしばらく考えさせられた。どっちなんだろ?
LIVE-GON(リベゴン)
Re: (スコア:0)
JustSystemsの製品:日本語ネイティブの作成文章が対象&ルールベースの校正
本ストーリーの技術:非日本語ネイティブの作成文章がターゲット&履歴ベースの校正
って感じでしょうか。
JustSystemsの校正は「ら抜き表現」「のの連続」などを厳しくチェックしてきそう……。
Re:あれ? (スコア:1)
お仕事でちょくちょく使っていますが、Just Right!はそこら辺たしかにうるさく指摘してきますね。
とはいえ、文脈を読んで「お願いいたします。」という語が2回連続で出てきたら指摘するといったことまではしてくれません。
正しい・美しい日本語に直すというよりは、誤入力のチェックや表記の統一にかける時間を削減する用途で使うくらいがちょうどいいと考えています。
そう言えば (スコア:0)
富士通は数年前に音声合成ソフトを発表してた気がするけど、
あれから全く話題に上らないな。飽くまで「技術を開発した」と言う
アナウンスだけで、商品化まではしないつもり?
Re:そう言えば (スコア:1)
Xerox…
はじける加齢の香り!orz