アカウント名:
パスワード:
あのゴミコメントの山を何に使うかは想像できないけど、とにかくだれでも使えるよう公開するという姿勢は好感。
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
↑得られるデータがこれだけだと、何に使うか想像できない。
00:02 これは期待00:05 わくわく00:05 Twitterから来ました :01:15 wwww01:16 wwwwwwwwwwww01:16 wwwwwwww01:16 wwwwwwwwww01:17 wwwwww :01:30 GJ01:30 GJでした01:31 とりあえずマイリス
↑うまく分析すれば何かに活用できるかも!
# まあ、やっぱり私には想像できないのですが。
今回のはコメントだけじゃなくてタグとか被ブックマーク数なんかも有るみたいですから色々使えるのかもしれませんね。
こちらに結構まとってますけどhttp://staff.aist.go.jp/masahiro.hamasaki/niconico.html [aist.go.jp]
サッカーとかで「おおおおおおお」とかが多かったら例えばその時間は何かの事象が起きているシーンだと判別するとか、女性キャラのタグが付いてて、「ふぅ…」とかが多く出てる所は微エロ系のギャグのオチの部分であるとか動画の状況の分析とかもあるみたいです。
タグの派生の仕方からコンテンツの伝搬の傾向を分析とかありましたね。ニコニコ学会βで何回か公開されていました。
ちなみに今までこういうのを調べていた方はドワンゴに許可をとって、スクレイピングして調べてたらしいですね。
表示位置は上中下以外に、詳しくは知らないけど、座標も指定できるっぽい。動画内の物体(顔とか)の位置に合わせてコメントで落書きしてる人がいた気がする。生放送でもAAでアニメーションさせたりしてる人いるし。
「投稿日時、コメント位置」だから表示座標じゃないかなぁ。
「投稿日時」はまさしく投稿された日時、「コメント位置」は動画のタイムスケールに対するコメントの位置ですね、おそらく。
座標指定みたいに見えるのは上あるいは下にコメントするコマンドで、縦方向はダミーを入れることによって何段目になるかで調整、横方向は基本センタリングなんで同じくダミーのスペースを入れることで調整しているんじゃなかったかな#もっとノウハウがあるかもしれないけど、これ以上はわからん
生放送のほうはよく知らない(苦笑)
ちょうど先日発表されていたのですが、いわゆる「釣り動画」は最初、または動画中盤の一瞬だけにコメントが集中する…など明らかに通常の動画と違うコメントのつきかたの特徴があり、コメントのパターンを解析すれば精度高く判別が可能だとか。
個別で見れば「ゴミみたいなデータ」のように見えても、数がまとまれば解析次第でいろいろな情報が得られるし、そういった研究をするためには、誰でも・再現可能な(同じデータセットが入手可能な)・ダミーではない本物の・そして大量のデータセットが配布されるというのは非常に意味のあることなのです。
なるほど。
この手の分析はTwitterなどでも研究されていて、たとえばコメントに含まれる語から(機械的に)ネガティブかポジティブを判断して評価、なんてことも行われているようです。
Nico動の場合、まずコメント対象が動画なので、必然的に「コメントされたのは動画のどのタイミングか」を動画内容とセットで分析しないといけない、という難しさまでは容易に想像できます。それに加えて厄介なのが、動画の系統によっては、コメントに特殊かつローカルルールが多い(たとえば「⑨」とか、特定のキャラに対して緑字で「ツマンネ」とか)傾向があるところ。各々の動画のコメントについて個別に(人力で)分析・評価するだけなら難しくはないでしょうけど、高精度の分析を機械化・自動化するにはいろいろとノウハウが必要そう…。
意味はあることなのかもしれないが意味を理解することは大変だね。
弾幕とかAAとか、そのタイミングでないと意味ないとか(動画を見ないと意味不明なコメント)、いくつかのコメントを合わせてイメージとして見ないと意味ないとか(テキストデータとしては無意味)、そういうコメントはどう扱うんだろうな。
時間データもあるならAAは何とかなるか。動画内容とリンクしてるコメントは大半がゴミになりそう。「あっ」とか「ふぅ・・・」とか「888888」とか。
キマシとかコメントあっても知らなきゃなんのこっちゃだろうなぁw
最近だとおこなの?こっちはまだわかるか
機械学習にとってスラングというものは知ってる・わかるということでなく単に「ある時期以降に頻出しはじめる字句」と見えるだけじゃないですかね。
そもそもニコ厨のコメントやレスそのものが流行りのフレーズを脊髄反射で垂れ流してるだけの「ゆらぎのあるタグの羅列」でしかないのですから、人口無能による精巧なサクラなんかも簡単に作れそうですね。ニコニコ動画のコメントでチューリングテストするのも面白いかも。
>動画内容とリンクしてるコメントは大半がゴミになりそう。>「あっ」とか「ふぅ・・・」とか「888888」とか。
なんでこれが「ゴミになりそう」と思えるのかさっぱりわからない。そういったコメントの傾向(パターンや割合)、コメント数と再生数・マイリスト数の相関を取ってみるとか日時から履歴を作って時代とともに評価(コメントの傾向)が変化した動画を検出してみるとかいろいろできること、やると面白そうな研究はあると思うんですが。
あくまでもこれは「まとまった分量のデータがある」ことがポイントなので、コメント単体の意味解析だけにしか視線を向けないのはずいぶん外してる感があります。
元動画は消えたわけじゃないんだから、例えば気になるコメントが動画の何処で書かれたかを知ることは出来るでしょう。やっちゃいかん事になってるけど、DLして動画を解析すればデータと静止画像のヒモ付も可能。
それをしてどうするかは、やっぱわからないんですけどね。
都市鉱山的ではあるねゴミの山から貴金属を探す・・・『生ゴミ』から貴金属を探しても出てくるかは疑問だが
素直に『データマイニング』でいいじゃないですか。
一般投稿動画ではなく企業が提供している動画においては視聴者の反応を加工しやすいデータで取得できるのは結構有用性がありそう・実験的に組み入れたあのシーンの効果はどうだったのか?・広告動画に対する反応とか
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
面白い (スコア:1)
あの
ゴミコメントの山を何に使うかは想像できないけど、とにかくだれでも使えるよう公開するという姿勢は好感。
「コメント位置」ってコメント時間ですよね? (スコア:3)
↑得られるデータがこれだけだと、何に使うか想像できない。
↑うまく分析すれば何かに活用できるかも!
# まあ、やっぱり私には想像できないのですが。
Re:「コメント位置」ってコメント時間ですよね? (スコア:3)
今回のはコメントだけじゃなくてタグとか被ブックマーク数なんかも有るみたいですから色々使えるのかもしれませんね。
こちらに結構まとってますけど
http://staff.aist.go.jp/masahiro.hamasaki/niconico.html [aist.go.jp]
サッカーとかで「おおおおおおお」とかが多かったら例えばその時間は何かの事象が起きているシーンだと判別するとか、女性キャラのタグが付いてて、「ふぅ…」とかが多く出てる所は微エロ系のギャグのオチの部分であるとか動画の状況の分析とかもあるみたいです。
タグの派生の仕方からコンテンツの伝搬の傾向を分析とかありましたね。
ニコニコ学会βで何回か公開されていました。
Re:「コメント位置」ってコメント時間ですよね? (スコア:2)
ちなみに今までこういうのを調べていた方はドワンゴに許可をとって、スクレイピングして調べてたらしいですね。
Re:「コメント位置」ってコメント時間ですよね? (スコア:1)
表示位置は上中下以外に、詳しくは知らないけど、座標も指定できるっぽい。
動画内の物体(顔とか)の位置に合わせてコメントで落書きしてる人がいた気がする。
生放送でもAAでアニメーションさせたりしてる人いるし。
「投稿日時、コメント位置」だから表示座標じゃないかなぁ。
Re: (スコア:0)
「投稿日時」はまさしく投稿された日時、「コメント位置」は動画の
タイムスケールに対するコメントの位置ですね、おそらく。
座標指定みたいに見えるのは上あるいは下にコメントするコマンドで、
縦方向はダミーを入れることによって何段目になるかで調整、
横方向は基本センタリングなんで同じくダミーのスペースを入れることで
調整しているんじゃなかったかな
#もっとノウハウがあるかもしれないけど、これ以上はわからん
生放送のほうはよく知らない(苦笑)
Re: (スコア:0)
ちょうど先日発表されていたのですが、
いわゆる「釣り動画」は最初、または動画中盤の一瞬だけにコメントが集中する…など明らかに
通常の動画と違うコメントのつきかたの特徴があり、コメントのパターンを解析すれば精度高く判別が可能だとか。
個別で見れば「ゴミみたいなデータ」のように見えても、数がまとまれば解析次第でいろいろな情報が得られるし、
そういった研究をするためには、誰でも・再現可能な(同じデータセットが入手可能な)・ダミーではない本物の・そして大量の
データセットが配布されるというのは非常に意味のあることなのです。
Re:「コメント位置」ってコメント時間ですよね? (スコア:2)
なるほど。
この手の分析はTwitterなどでも研究されていて、たとえばコメントに含まれる語から(機械的に)ネガティブかポジティブを判断して評価、なんてことも行われているようです。
Nico動の場合、まずコメント対象が動画なので、必然的に「コメントされたのは動画のどのタイミングか」を動画内容とセットで分析しないといけない、という難しさまでは容易に想像できます。
それに加えて厄介なのが、動画の系統によっては、コメントに特殊かつローカルルールが多い(たとえば「⑨」とか、特定のキャラに対して緑字で「ツマンネ」とか)傾向があるところ。各々の動画のコメントについて個別に(人力で)分析・評価するだけなら難しくはないでしょうけど、高精度の分析を機械化・自動化するにはいろいろとノウハウが必要そう…。
Re: (スコア:0)
意味はあることなのかもしれないが
意味を理解することは大変だね。
Re: (スコア:0)
弾幕とかAAとか、そのタイミングでないと意味ないとか(動画を見ないと意味不明なコメント)、
いくつかのコメントを合わせてイメージとして見ないと意味ないとか(テキストデータとしては無意味)、
そういうコメントはどう扱うんだろうな。
時間データもあるならAAは何とかなるか。
動画内容とリンクしてるコメントは大半がゴミになりそう。
「あっ」とか「ふぅ・・・」とか「888888」とか。
Re:面白い (スコア:1)
キマシ
とかコメントあっても知らなきゃなんのこっちゃだろうなぁw
最近だと
おこなの?
こっちはまだわかるか
Re: (スコア:0)
機械学習にとってスラングというものは知ってる・わかるということでなく
単に「ある時期以降に頻出しはじめる字句」と見えるだけじゃないですかね。
そもそもニコ厨のコメントやレスそのものが
流行りのフレーズを脊髄反射で垂れ流してるだけの
「ゆらぎのあるタグの羅列」でしかないのですから、
人口無能による精巧なサクラなんかも簡単に作れそうですね。
ニコニコ動画のコメントでチューリングテストするのも面白いかも。
Re:面白い (スコア:1)
>動画内容とリンクしてるコメントは大半がゴミになりそう。
>「あっ」とか「ふぅ・・・」とか「888888」とか。
なんでこれが「ゴミになりそう」と思えるのかさっぱりわからない。
そういったコメントの傾向(パターンや割合)、コメント数と再生数・マイリスト数の相関を取ってみるとか
日時から履歴を作って時代とともに評価(コメントの傾向)が変化した動画を検出してみるとか
いろいろできること、やると面白そうな研究はあると思うんですが。
あくまでもこれは「まとまった分量のデータがある」ことがポイントなので、コメント単体の
意味解析だけにしか視線を向けないのはずいぶん外してる感があります。
Re: (スコア:0)
元動画は消えたわけじゃないんだから、
例えば気になるコメントが動画の何処で書かれたかを知ることは出来るでしょう。
やっちゃいかん事になってるけど、DLして動画を解析すればデータと静止画像のヒモ付も可能。
それをしてどうするかは、やっぱわからないんですけどね。
Re: (スコア:0)
都市鉱山的ではあるね
ゴミの山から貴金属を探す
・・・
『生ゴミ』から貴金属を探しても出てくるかは疑問だが
Re: (スコア:0)
素直に『データマイニング』でいいじゃないですか。
Re: (スコア:0)
一般投稿動画ではなく企業が提供している動画においては
視聴者の反応を加工しやすいデータで取得できるのは結構有用性がありそう
・実験的に組み入れたあのシーンの効果はどうだったのか?
・広告動画に対する反応
とか