パスワードを忘れた? アカウント作成
2585983 story
人工知能

富士通研、人手による校正履歴を用いた日本語自動校正技術を発表 38

ストーリー by reo
むしろ僕が欲しい 部門より

apt 曰く、

富士通研究所は、人が校正した文章の履歴を使って文章校正を自動的に行う技術を開発したそうだ (富士通研究所のプレスリリースクラウド Watch の記事より) 。

近年、中国を中心にオフショア開発が増加しているが、外国人にとって日本語の執筆は難しく、「て」「に」「を」「は」などの助詞の誤り、用語の使い方の誤りなどがしばしば発生する。これを校正する日本人担当者の仕事を代替し、外国人執筆者が効率的に校正できるシステムが求められていた。そこで、過去の校正履歴を用いて似たような誤りを自動で検出、修正する技術を開発したとのこと。

昨日、Lenovo IdeaPad のマニュアルの日本語がひどいというストーリー (/.J 記事) が掲載されていたが、こういう技術を使えば少しはマシなマニュアルを書けるようになるのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • トピックのタイトル (スコア:4, おもしろおかしい)

    by numa (4467) on 2012年04月10日 12時04分 (#2132718) ホームページ 日記

    「日本語自動構成技術」って…。

    この技術を使えば、スラドもちゃんと校正してもらえるかもしれませんね。

    • by reo (4042) on 2012年04月10日 12時46分 (#2132785) 日記

      修正しました。ご指摘 thx です。

      # 部門名とタイアップした高度なエスプリなんですよ (ということにしておいてください) 。

      --
      Hiroki (REO) Kashiwazaki
      親コメント
    • by apt (28270) on 2012年04月10日 12時31分 (#2132757) 日記

      あちゃー。やってしまいました。ごめんなさい。
      訂正よろしくお願いします。>編集者様

      言い訳をすると、「自動構成」に引っ張られてIMEが変換してしまったのを見逃したのでしょう

      親コメント
    • by Anonymous Coward

      コピペすればいいのに何故手打ちしてわざわざ間違えるんだろ

      • by Anonymous Coward

        きっと、文章中に同じ単語が出てきたかどうかを全て記憶しておいて、それを文章中から探し出して、コピーしてペーストする手間を惜しんだのでしょう。
        どうしてそういうことになったのかは、良い表現や文の流れなどをいろいろ推敲しながら文章を書くことを想像してみればわかるんじゃないかと思います。

        # それとも単語の切り貼りの手間を惜しまないことで変換ミスを無くせば、こんな自動校正のシステムは要らないだろうっていう高度なネタ?

  • というオチだったら笑えるんだけど、意外とそうでもないので笑えない。

  • by prankster (12979) on 2012年04月10日 11時57分 (#2132713)
    「三面六臂」と書いたら「八面六臂」に、「まん真ん中」と書いたら「ど真ん中」に、あたりはまあいいんだけど、「的を射た」と書いたら「的を得た」に、「名誉挽回」と書いたら「汚名挽回」推敲されちゃったりするとヤダなぁ。
  • by fault (18699) on 2012年04月10日 12時00分 (#2132716)
    日本人が書いた英文の校正にも使えると助かる 文法チェックだけでなく、英文として自然な言い回しや用語に直してくれるとありがたい。
  • by minet (45149) on 2012年04月10日 12時24分 (#2132746) 日記

    この技術を搭載した製品のマニュアルは、当然その製品によって校正されるんだろうね?

    #それでも誤字が見つかった時は「当技術を使用した証明です」と言えばよろしい。

  • そうなるまで、「日本人校正者」が、
    文章を校正する手間&システム入力する手間
    がかかるんでなければ良いのですが。

    そして、担当者が入力する手間を忌避してシステムがいっこうに完成しない落ち。

  • by kiralin7566 (36977) on 2012年04月10日 14時28分 (#2132896) 日記

    これ [justsystems.com]は?

    「外国人が書いた(ちょっと不自然な)日本語」を校正支援する、ってところがミソなのかしら。

    --
    はじける加齢の香り!orz
    • by Hamo73 (35938) on 2012年04月11日 1時02分 (#2133215)

      プレスリリースより引用:

      これまでも、文章作成において文章の誤りを指摘したり、正しい語句を提示するような文章校正支援技術や製品が開発されています。これらには、不適切な単語や置き換えるべき表現を事前に辞書登録しておき、原文と辞書の表記がマッチした部分を正しい語句に置き換えることで文章校正を支援する手法が用いられています。しかし、辞書の追加やメンテナンスに継続的な工数がかかるうえ、検出できる対象が無条件に文字列置換えができるものに限定されるなどの制約がありました。このため、一つの文章の中に複数の誤りが存在するような対象、例えば、「梅雨は雨を降ります」といった文章を修正するには、「梅雨の雨」のほか「春の雨」、「夏の雨」、「秋の雪」、「春の雪」など、あらゆる組み合わせを登録する必要があり、対応が困難でした。そこで、校正担当者のように幅広い表現に対応することができ、かつ、低コストで運用できる文章校正技術の開発が課題となっていました。

      この製品の売りは、あらかじめ辞書を用意することはせず、校正履歴との類似度だけで判定するところです。専用辞書を作成する必要はなく、単語の組み合わせが違っていても応用が効きます。プレスリリースでは、「冬は雪を降ります」→「冬には雪が降ります」という校正履歴があれば上記の例を「梅雨には雨が降ります」と校正できると説明しています。

      ただこのシステムは、構文を見ているだけで意味はチェックしませんから、「梅雨は雪を降ります」とあった場合、「梅雨には雪が降ります」に直して校正済みになります。文脈を読んだり筆者に問い合わせるなどして、「冬には雪が振ります」「梅雨には雨が振ります」あるいは「梅雨には雪は降りません」と直すような校閲作業はできません。

      また、類似した校正履歴がないタイプの誤記は修正できません。しっかりした校正担当者が校正履歴に付け加えることで初めて対処できるようになります。

      今回開発した技術を用いることで、執筆者が外国人でも日本語文章を執筆者自身で校正できるようになりました。

      というのはちょっと盛り過ぎで、単純な誤記を下校正しておくことで校正担当者の負担を軽減させるという使い方が適切でしょう。

      親コメント
      • by kiralin7566 (36977) on 2012年04月11日 1時20分 (#2133219) 日記

        ここにまとめてレスしちゃいますが。

        なるほどなるほど、解説ありがとうございます。
        キモは「日本話者が書いた表現の揺れを直す」と「非日本語話者の文法上の誤りを直す」
        ってところに違いがあるんですね。
        ということは、多段で通すとより綺麗な日本語になるんですかね?とか素人考えでしょうか。
        あと、レスにもありますが校正履歴に残す人には綺麗な日本語へ直せるような技術が確実に
        要りますね。
        IT関連の方(営業さんも技術屋さんも)の不思議な日本語を(特にメールで)結構
        目にすることがあるんで。

        # 「~の確認をお願いします。以上よろしくお願いします」と「お願いします」が多段に
        # なってたり。

        --
        はじける加齢の香り!orz
        親コメント
      • by Anonymous Coward

        「降ります」と「振ります」が気になる……

        #あげあしなんどえAC

    • by Anonymous Coward

      JustSystemsの製品:日本語ネイティブの作成文章が対象&ルールベースの校正
      本ストーリーの技術:非日本語ネイティブの作成文章がターゲット&履歴ベースの校正

      って感じでしょうか。
      JustSystemsの校正は「ら抜き表現」「のの連続」などを厳しくチェックしてきそう……。

      • by takepierrot (39218) on 2012年04月13日 20時14分 (#2135263) 日記

        お仕事でちょくちょく使っていますが、Just Right!はそこら辺たしかにうるさく指摘してきますね。
        とはいえ、文脈を読んで「お願いいたします。」という語が2回連続で出てきたら指摘するといったことまではしてくれません。
        正しい・美しい日本語に直すというよりは、誤入力のチェックや表記の統一にかける時間を削減する用途で使うくらいがちょうどいいと考えています。

        親コメント
  • by Anonymous Coward on 2012年04月10日 16時32分 (#2132971)

    富士通は数年前に音声合成ソフトを発表してた気がするけど、
    あれから全く話題に上らないな。飽くまで「技術を開発した」と言う
    アナウンスだけで、商品化まではしないつもり?

typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...