アカウント名:
パスワード:
雑なピクセル比較で品質を評価してGuetzliをディスってたせい、かつ投稿者もスルースキル無くて半炎上状態にあるな。
とはいえ擁護派もあんまり説得的じゃない感じ。「Google様の考えたButteraugliアルゴリズムでよいスコアになるようなエンコーダーなんだから、それで評価しないのは筋違いだー」って批判してるんだけど、そのButteraugliアルゴリズムがどういうものかは擁護派も理解していないという。
この論評 [qiita.com]によると、
ソースコードをのぞくと結構な数のマジックナンバー(定数値)が散りばめられており、それらの値をどうやって決めたのか/なぜその値が妥当なのかという説明を見つけられませんでした。
「俺が考えた最強のアルゴリズム実装してみた」感が拭えず、もう少し情報がほしいなと思う次第です。
だそうで。
機械学習ってマジックナンバーの塊だよ
定量評価したいなら PSNR くらいしかないが(ほかにあるなら教えて)、結局は画像コーデックはNを稼いだ官能評価しかないんじゃないかと思うんだが。
まあ思考停止するのは自由だけど、このGuetzliはその官能評価とやらをどれだけやってるのかね。
擁護している人たちの根拠は何? と考えると、結局Googleブランドにころっとまいってるだけじゃないかと思える。
「ニューラルネットワークは気味が悪い」というのは共通認識ではあるらしい。
要するに、適切かどうかわからないネットワークを構築し、十分に代表的であることを祈るしかない画像でトレーニングし、うまく機能する理由または重大な間違いが生じる理由は正確にはわからない、ということです。優秀なエンジニアがどうしてこんなことができるでしょうか。
研究者やますます多くのエンベデッド・システム開発者がわざわざこんな苦労をする理由は簡単です。それは CNN がうまく機能することにほかなりません。トレーニング結果は、概して実際の結果を予測しています。また、CNN は標準的な物体認識および分類問題において、その他のアルゴリズムを上回る性能を一貫して示しており、物体のサイズ、位置、および照明の変化に比較的反応しにくいという特長もあります。さらに、Google とスタンフォード大学の研究者らが最近発表した論文によれば、異なる CNN のクラスタは、画像内の物体の分類だけでなく、画像内の状況を説明するキャプションの記述にも高度な正確性を示すことが明らかになっています。現在、そこまで到達している既知のアルゴリズムは他にありません。
http://systemdesign.altera.co.jp/can-you-see-using-convolutional-neura... [altera.co.jp]
Alpha Goのアルゴリズムの詳細を人間が人間に説明できるわけがないと思うんですけど。説明できなきゃ気がすまないならAIは絶対に人間を超えられない。
まあ何が思考停止なんだかよくわからんが、この技術の擁護者は自分の官能性を信じたんだろう?もはや誰もとがめることはできないと思うんだが。
なんつーか、なんでもGoogleだと噛みつくの、やめね?
画像を見て、息子に評価させるのですね。最大角度を100として…。
え、いかに官能的かを評価するのですよね? ね?
レナさん画像の官能評価ですね
最大角度は腹に当たるから180弱だろ
察しろよ!!(ノД`)
ヒント:中年太り
割とシャレになってないと思う。入力評価値は好ましさで、ニューラルネットワークの設計は勘だもの。そのうち画像や映像系アフィブログが協力者に電極を取り付けて反応する特徴を学習させるようになるかもしれん。いや、今から始めてもいいな。画像をくれ。
しかしそのブロックのイズの言及はアップミスによりQiitaが再エンコードをしてしまった結果という……再エンコードされて無いやつには同様の言及は今のところ無いね。
結局100倍時間をかけた効果はオレオレ評価プログラムの中にしか無いという感じ。
炎上したというQiitaの記事の「現時点では使い物にならん」というのは事実だろう。技術的なデモンストレーションで実用化には時間を要するみたいな感じで。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
リンク先のQiitaの記事 (スコア:0)
雑なピクセル比較で品質を評価してGuetzliをディスってたせい、かつ投稿者もスルースキル無くて半炎上状態にあるな。
Re:リンク先のQiitaの記事 (スコア:1)
とはいえ擁護派もあんまり説得的じゃない感じ。
「Google様の考えたButteraugliアルゴリズムでよいスコアになるようなエンコーダーなんだから、
それで評価しないのは筋違いだー」って批判してるんだけど、そのButteraugliアルゴリズムがどういうものかは
擁護派も理解していないという。
この論評 [qiita.com]によると、
ソースコードをのぞくと結構な数のマジックナンバー(定数値)が散りばめられており、それらの値をどうやって決めたのか/なぜその値が妥当なのかという説明を見つけられませんでした。
「俺が考えた最強のアルゴリズム実装してみた」感が拭えず、もう少し情報がほしいなと思う次第です。
だそうで。
Re: (スコア:0)
機械学習ってマジックナンバーの塊だよ
定量評価したいなら PSNR くらいしかないが(ほかにあるなら教えて)、
結局は画像コーデックはNを稼いだ官能評価しかないんじゃないかと思うんだが。
Re: (スコア:0)
まあ思考停止するのは自由だけど、このGuetzliはその官能評価とやらをどれだけやってるのかね。
擁護している人たちの根拠は何? と考えると、結局Googleブランドにころっとまいってるだけじゃないかと思える。
Re:リンク先のQiitaの記事 (スコア:2, 参考になる)
「ニューラルネットワークは気味が悪い」というのは共通認識ではあるらしい。
要するに、適切かどうかわからないネットワークを構築し、十分に代表的であることを祈るしかない画像でトレーニングし、うまく機能する理由または重大な間違いが生じる理由は正確にはわからない、ということです。優秀なエンジニアがどうしてこんなことができるでしょうか。
研究者やますます多くのエンベデッド・システム開発者がわざわざこんな苦労をする理由は簡単です。それは CNN がうまく機能することにほかなりません。トレーニング結果は、概して実際の結果を予測しています。また、CNN は標準的な物体認識および分類問題において、その他のアルゴリズムを上回る性能を一貫して示しており、物体のサイズ、位置、および照明の変化に比較的反応しにくいという特長もあります。さらに、Google とスタンフォード大学の研究者らが最近発表した論文によれば、異なる CNN のクラスタは、画像内の物体の分類だけでなく、画像内の状況を説明するキャプションの記述にも高度な正確性を示すことが明らかになっています。現在、そこまで到達している既知のアルゴリズムは他にありません。
http://systemdesign.altera.co.jp/can-you-see-using-convolutional-neura... [altera.co.jp]
Re: (スコア:0)
Alpha Goのアルゴリズムの詳細を人間が人間に説明できるわけがないと思うんですけど。
説明できなきゃ気がすまないならAIは絶対に人間を超えられない。
Re: (スコア:0)
まあ何が思考停止なんだかよくわからんが、この技術の擁護者は自分の官能性を信じたんだろう?
もはや誰もとがめることはできないと思うんだが。
なんつーか、なんでもGoogleだと噛みつくの、やめね?
官能評価 (スコア:0)
画像を見て、息子に評価させるのですね。
最大角度を100として…。
え、いかに官能的かを評価するのですよね? ね?
Re:官能評価 (スコア:1)
レナさん画像の官能評価ですね
Re: (スコア:0)
最大角度は腹に当たるから180弱だろ
Re:官能評価 (スコア:1)
察しろよ!!(ノД`)
Re: (スコア:0)
ヒント:中年太り
Re: (スコア:0)
割とシャレになってないと思う。入力評価値は好ましさで、ニューラルネットワークの設計は勘だもの。
そのうち画像や映像系アフィブログが協力者に電極を取り付けて反応する特徴を学習させるようになるかもしれん。
いや、今から始めてもいいな。画像をくれ。
Re: (スコア:0)
JPEGの粗悪なエンコーダで圧縮するとブロックノイズが出てしまって見るに堪えないです。
Re: (スコア:0)
しかしそのブロックのイズの言及はアップミスにより
Qiitaが再エンコードをしてしまった結果という……
再エンコードされて無いやつには同様の言及は今のところ無いね。
結局100倍時間をかけた効果は
オレオレ評価プログラムの中にしか無いという感じ。
炎上したというQiitaの記事の「現時点では使い物にならん」というのは事実だろう。
技術的なデモンストレーションで実用化には時間を要するみたいな感じで。