特許文書を読みやすくする技術、登場 35
ストーリー by GetSet
却って誤読を招かない? 部門より
却って誤読を招かない? 部門より
Yggdra曰く、"難解な特許文書に日々頭を悩ませている人に朗報かも。ITmediaの記事によると、NTTデータが、特許文書を分析し、視覚的に表示し、また類似特許の検索のためのキーワードを抽出する技術を開発したそうだ。(参考:ニュースリリース)
形態素解析を用いてパターン化するというのは昨今ありふれた手法だが、この技術は高度に構造化されている特許文書に特化したのが特徴。それによって、より精度の高い解析が可能になると期待される。特許文書は読みづらい上に、技術者にとっては嫌々読まなければならない文書の一つであり、その面倒さが軽減されるのは歓迎できる。
タレコミ者としては、その元の文書をどうにか読みやすいものにして欲しい、というのが本音なのだけれど(^^;"
手前味噌ですが…… (スコア:2, 参考になる)
つまり、 これ [srad.jp] を自動化したのですね。
当然この技術も (スコア:1)
読みやすくするとどうなるんだろう?
逆変換 (スコア:1, おもしろおかしい)
そこで特許文書を書かれる方に質問なのですが、もしかして、普通の文書からあの文書に変換したり、グラフを書くとあの文書が生成されるようなツールを使ってたりするんでしょうか?
#ツール使ってるのなら、その元データも提供すればいいじゃんと思ったりして。
Re:逆変換 (スコア:2, 参考になる)
しかも、それを一文で書かなくてはいけないので、かなり四苦八苦して書いてました。
特許は、土地と同じような排他的な財産です。そして、請求項は、それを明確にするため、論理的な構成であり、論理的な言葉である必要があります。
メカ系のものなど見た目で分かるものはやり易いのですが、制御系などの無形なものを、上記のことを踏まえて、請求項という形にするのですから、慣れてる人間だって、難しいものです。
ちなみに、私が頭がいいと思うのは、特許を出す人でも、書く人でもなく、自分の関わる製品の仕様を理解し、問題になりそうな他社の特許を理解し、侵害しないという論点を見出せる開発者です。
(こういう人が味方のうちはいいのですが、反対に立場に回られると...何度も泣かされました)
Re:逆変換 (スコア:2, 興味深い)
Re:逆変換 (スコア:1)
amazon によると、その本が出たのは1998年ということですが、そういう主張があってなお、今のように一文で書かれるのが大半ですよね。ということは、
(1) その主張は主流派ではないので黙殺されている
(2) その主張は主流派であって、今後はそうなっていくが現状はまだ途上段階である
(3) その主張は主流派であって、法論理からすればその通りだけど実務上の問題から変化がない
のどれなんでしょうか?
Re:逆変換 (スコア:1)
いやそういうのを頭がいいと言うかは別問題ですが。
Re:逆変換 (スコア:1)
問題はコンパイルされた文書のデバッグの必要があることなんですが…読めません。
Re:逆変換 (スコア:0)
本当に大変なのは、競合他社のワケワカメな文章を読まなければ
ならないときの方です。(会社のノルマで出したような内容のない
特許だと分かったときの脱力感と言ったら…)
基本的に請求項の書き方は決まっています。
AとかBとか、特許にしたいシステムの構成要素をずらずら並べ、
「これがああなったときにどうなる」ことを特徴とするナニナニ、
で請求項1。
後は「請求項1において、ナントカがカントカであることを特徴と
するナニナニ、で請求項2。
以下、繰返し。
後ろに続く背景とか実施例はそのまま読めます。
図で示したものの
Re:逆変換 (スコア:0)
明細書の中には同じ文章をコピペするような部分があるので、そこを自動的に処理する感じです
でも基本は人力ですね。プログラムと同じだと思います。
宣言的プログラミング (スコア:1)
ただ、記述言語が自然言語(日本語)だから、あんなことになってるけど。
ほんでもって、実行or検証用の処理系が無いから、記述にバグだらけ。
Re:宣言的プログラミング (スコア:1)
Re:宣言的プログラミング (スコア:0)
--
挿入されるICカードを誘導しかつ位置決めする誘導手段をAとする。
ICカードの導電領域に対して電気的に接続させられる複数の接触子を保持した接触フレームをBとする。
BによってICカード挿入方向に離間した休止位置と作動位置との間で移動可能に支持され、かつ挿入されたICカードによって作動位置に押し
Re:宣言的プログラミング (スコア:1)
--
挿入されるICカードを誘導しかつ位置決めする誘導手段を甲とする。
ICカードの導電領域に対して電気的に接続させられる複数の接触子を保持した接触フレームを乙とする。
乙によってICカード挿入方向に離間した休止位置と作動位置との間で移動可能に支持され、かつ挿入されたICカードによって作動位置に押し動かされるキャリッジを丙とする。
(中略)
本件は、甲と乙とを具備し、これら接触子を介してICカード読取り機を内包した装置との間に回路が形成されるようになっているICカード読取り機であって、...
Re:宣言的プログラミング (スコア:0)
ところで、甲乙丙丁っていくつまであるんだろ?
Re:宣言的プログラミング (スコア:1)
Re:宣言的プログラミング (スコア:1)
・甲甲、甲乙、甲丙、…、乙甲、乙乙、…
とするのでしょうか。
初めから、
・甲子、乙丑、丙寅、…
で、60個確保しておく手もありますが。
Re:宣言的プログラミング (スコア:0)
「~であって」の箇所には発明特定事項に関する文章は入れません。
本件は、甲と乙とを具備し、これら接触子を介して
ICカード読取り機を内包した装置との間に回路が
形成されるようになっているICカード読取り機であって、...
回路を構成していることに発明の特徴がないなら、
回路は請求項の発明特定事項には
もっと人間的な言い回しにしてくれたら便利 (スコア:1)
ICカードについてるあの金ピカの部分とくっつく相方(複数)が ついてるフレームをBとする。
ICカードを載せる台みたいなのがあって(台じゃなくてもいいけど :-)、その台が何もしてないときに休んでる位置とカードを読み書きしてる時の位置の間をICカード載せながら動くようになっててBで固定されるようになっている(ここちょっと自信ない)。
(中略)
この特許はAとBがあって、この金ピカの相方を使ってICカード読取り機が入ってる装置との間に回路が形成されるようになっているICカード読取り機であって(面倒くさいので適当)、...
あんまり意味ないかも
AVG anti-virus data base out of date
Re:宣言的プログラミング (スコア:1)
Youthの半分はバファリンでできています。
公報なら既にXMLですよね (スコア:1)
特許庁発行のDVD-ROM公報のフォーマットはXMLなので、
申請する文書も最初からXMLにできなくもない気はしますね。
しかし、昨年はCD-ROMのSGMLからDVD-ROMのXMLへ切り替わるので大変でした。
そしてH18年1月には、IPCが8版に。
特許庁の実務者説明会、福岡は満員と盛況ですね。
でも (スコア:1, すばらしい洞察)
本文から変換された文章は伝聞にしか過ぎませんから
法的にどうかという解釈の場合もう一度読む必要があります。
結局、成れたほうが手っ取り早い気がするんですよね
#難解な文章より
#わかりやすい文章の書き方を具体的に決めたほうがいいと思うのですが。
Re:でも (スコア:2, 興味深い)
弁理士の資格を持つ客員教授の台詞ですけど、特許文書というのは「難解に見えるけど構造がだいたい決まっているので、慣れれば わかりやすい」んだそうです。問題は、一般人は慣れないところにあるんですけどね。あれは日本語じゃないと思った方がいい、と、その教授は言っておりました。
ただ、だからこそこんな機械的な解析が効果を上げやすいんだな、と思うと、功罪あるかな、という気がします。難しいところだなぁ。
Re:でも (スコア:1, 参考になる)
というわけなので、今回の技術も、結構的確に実現できているのではないかと思っています。特に特許文書に慣れていない人に対して効果的でしょうね。そういえば自分も、相関が複雑な請求項群をツリー形式に書き直したことがあったなぁ~
特許庁の中のお仕事をお手伝いしたことがあるのでACで……
Re:でも (スコア:1)
>膨大な数の審査請求をこなさなければならない特許庁内部ではそんな風に文書を読み飛ばしながらばっさばっさと……げふげふ。
慣れればバッサバッサと読めるんですよね。図面見て、技術分野見て、従来の技術と課題みて、課題の解決法見て…で、請求項読まなくても内容は大体わかります。請求項も、ほとんどのものは従属クレーム読み飛ばし。
Re:でも (スコア:0)
特許制度を欧米から持ってきたときに、向こうの特許を直訳したのが
始まりじゃないかと思っています。
米国特許は請求項(claim)の位置が一番後ろだったりして、ちょっと
形が違いますが
ありがとうございます (スコア:1, おもしろおかしい)
#おまえらいいかげんにせーよ
無効性判定 (スコア:0)
でも、もしかすると「特許文書を読みやすくする技術」の特許の無効が判明っていうオチが待ってるかも…
いや、本当に欲しいのは (スコア:0)
普通に読むだけで頭に入っていくような、多重参照などの
ない文章に直して、「~するところである装置」を「する装置」
などにしてくれるもの。
それで気になった箇所をマウスで選択して反転させると、
原文のどの箇所かを示してくれるようだと便利。
Re:いや、本当に欲しいのは (スコア:1)
ついでに,インデントだけなら,特に従来との互換性に問題がないはずなので, そもそもの元の特許文書の段階からインデントして書いておいて欲しい…
ちっちっ、分かってないな。 (スコア:0)
特許文書を読み込んで、
「萌える画像符号化装置」とか
「萌える!オンライン購入システム」
とかに変換してくれるソフトキボンヌ!
H.264符号化装置がメイド服着て出てきたりしたら、やだなぁ。
Re:ちっちっ、分かってないな。 (スコア:3, おもしろおかしい)
これと似てる (スコア:0)
しかしね (スコア:0)
製品化の目標が半年後というけれど (スコア:0)
「このシステムを利用した結果により生じたいかなる損害も補償するものではございません」とか、
そういう文言は健在なのだろうなぁ。
とは思うけれど、このテのシステムでその免責だと、なんだかとても複雑な気がする。