アカウント名:
パスワード:
嫌だと思うポイントが-自動生成で低情報含有率のくせに検索上位に来る-アフィリエイトをやっているのどちらであるかで、賛同できるかどうかが分かれますね。
両方だろう。
自動生成で低情報含有率で検索上位で、しかもアフィリエイトだからムカツク。どれか一つでも欠ければ、ここまで毛嫌いされないと思うがどうか。
でもまぁ、一番とほほなのは、他人のblogやニュース記事引き写しで自分の意見が3語ぐらいしかないblogですね。しかも、「とても楽しみですね」程度だったり。。。独り言の日記ならチラシの裏に書くか検索にひっかからないようにしてくれと。
自動生成された文章は技術的に排除できないのかね。逆に一応人間が引用している場合は内容の重み付けに利用したりとか。
自動生成かつアフィリエイトは論外ですねぇ。
自動生成された文章は技術的に排除できないのかね。
閾値をどうするかという問題はありますが、構文解析をすれば不可能ではないでしょう。
a. 「徹夜明けでヘミ猫互助会の健康食品hogeはすばらしい」 b. 「先日通販で買った健康食品hogeは良かった」
とあったとき、「aはbよりも日本語として変だ」と判定することはできます。 通常の日本語の言語モデルを何らかの方法で用意して(googleは「google-Nグラム」として実際にそういうものを研究者相手に売っています)、その言語モ
構文解析だけじゃ意味ないかと。例えば、
「やば、何が起きたか分からん、ポルナレフ状態w」「wwwwwwwwwwwww」「ちょ、おま、草生やしすぎwwww」
とか2chでは普通に見かける文章ですが、wの羅列はもちろんのこと、「草を生やす」なんて文脈的にも文章的にも意味不明ですし、「ポルナレフ状態」って何の状態だよって話ですよね。
機械的な判定であればこうした文章は意味のない文として全てはじかれることになります。でも見る人が見ればちゃんと意味が成立している文章であり、少なくとも自動生成ではないですよね。他にはAAやコピペなんかもはじかれる対象になりそうです。
言葉は時代により変遷するので、そうした変遷を常に追い続けている辞書の存在がなければ、構文解析ごときでなんとかなる世界ではないですよ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
アフィリブログも消えてくれたらいいのに (スコア:0)
Re: (スコア:1, すばらしい洞察)
嫌だと思うポイントが
-自動生成で低情報含有率のくせに検索上位に来る
-アフィリエイトをやっている
のどちらであるかで、賛同できるかどうかが分かれますね。
Re: (スコア:2, すばらしい洞察)
両方だろう。
自動生成で低情報含有率で検索上位で、しかもアフィリエイトだからムカツク。
どれか一つでも欠ければ、ここまで毛嫌いされないと思うがどうか。
でもまぁ、一番とほほなのは、他人のblogやニュース記事引き写しで自分の意見が3語ぐらいしかないblogですね。
しかも、「とても楽しみですね」程度だったり。。。
独り言の日記ならチラシの裏に書くか検索にひっかからないようにしてくれと。
Re: (スコア:1)
自動生成された文章は技術的に排除できないのかね。
逆に一応人間が引用している場合は内容の重み付けに利用したりとか。
自動生成かつアフィリエイトは論外ですねぇ。
Re: (スコア:0)
自動生成された文章は技術的に排除できないのかね。
閾値をどうするかという問題はありますが、構文解析をすれば不可能ではないでしょう。
a. 「徹夜明けでヘミ猫互助会の健康食品hogeはすばらしい」
b. 「先日通販で買った健康食品hogeは良かった」
とあったとき、「aはbよりも日本語として変だ」と判定することはできます。 通常の日本語の言語モデルを何らかの方法で用意して(googleは「google-Nグラム」として実際にそういうものを研究者相手に売っています)、その言語モ
Re: (スコア:2, 興味深い)
構文解析だけじゃ意味ないかと。
例えば、
「やば、何が起きたか分からん、ポルナレフ状態w」
「wwwwwwwwwwwww」
「ちょ、おま、草生やしすぎwwww」
とか2chでは普通に見かける文章ですが、
wの羅列はもちろんのこと、
「草を生やす」なんて文脈的にも文章的にも意味不明ですし、
「ポルナレフ状態」って何の状態だよって話ですよね。
機械的な判定であればこうした文章は意味のない文として全てはじかれることになります。
でも見る人が見ればちゃんと意味が成立している文章であり、
少なくとも自動生成ではないですよね。
他にはAAやコピペなんかもはじかれる対象になりそうです。
言葉は時代により変遷するので、
そうした変遷を常に追い続けている辞書の存在がなければ、
構文解析ごときでなんとかなる世界ではないですよ。
Re:アフィリブログも消えてくれたらいいのに (スコア:1)
#他にはブロガー猫 [srad.jp]のブログはどう判定されるのだろう、とか