aruto250の日記: word2vecというものを初めて知った 3
日記 by
aruto250
10年くらい前に人工無能を作りたいと思っていたとき浮かんだイメージに、単語が多次元の空間に存在していて、単語同士の距離や方角みたいなものがあり、その空間に死や生、喜怒哀楽といった身体的な価値観を包含させることで感情的な反応を持たせることができるのでは…とか考えていたんだけど、この多次元空間に浮かぶ言葉のイメージ、既にword2vecという実装まで出来ていたのだな。文系素人な自分の妄想と違ってちゃんとした理論に基づいた実装で、これ使い方によってはすごいものが作れるんじゃないか?何なら分析させるものが言葉や文章じゃなくても良さそうだしな。類義語には強いが対義語の区別がつかないという弱点も、確かに言葉だけ分析しているならさもありなんだけど、このあたりは何らかの「価値観」みたいな尺度を持たせないと区別できないのだろうな。
ベクトル検索 (スコア:2)
この言葉聞いたのは、もう20年くらい前20世紀だった。
言葉聞いた瞬間「あ、内積とるんか、うまいこと考えたな」とは思った。
今のGoogle翻訳がそれじゃないの? (スコア:0)
確か
レーベンシュタイン距離 (スコア:0)
昔そういや試しに作ったことあるなあ。
最近は意味の距離とかも考えるんやね。
ぱっとおもいつくのは文章での出現位置の距離を拾い出していくことかな?
英語だと同じ単語をなるべく使わないっていうルールがあるから簡単そうだけど、そういう文化がないと難しそう。