アカウント名:
パスワード:
「ウェブサイト」を「ホームページ」と呼ぶと怒る技術者の中にも「message digest」を「ハッシュ値」と平気で言っている人が非常に多かった印象なので、「ハッシュとの照合」と言うと「いわゆるファイルの SHA-256 ハッシュとかの値」と照合していると勘違いする人が出てきそうですが、そうではありません。
これは、画像の一部だけを書き換えるなどしてファイルの message digest が違っても、児童ポルノだと検出できる方式で、照合しているのは画像の特徴を抽出したデータで完全一致ではなくても検出されます。
誤検出の可能性は非常に低いとされてますが0ではありません(所謂ハッシュの衝突がどうのという話ではなく、それよりは遥かに高い確率ですしその確率が正しいと検証することも困難です)。
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。ただ、このハッシュ関数はファイルデータそのものに対して適用するのではないというだけです。
よく言われるのが、「児童ポルノを見つけるってことは、そのサービスの提供元は児童ポルノ画像を大量に持ってるんじゃね?」っていう誤解で、この問題を回避するために画像の特徴をハッシュ化して持っているわけです。
# とはいえ、何もない状態からハッシュ値を得られるかというとそうでもないわけで、# 必ず初期の学習段階ではそれなりの数の児童ポルノ(とそうでないもの)を処理しなければならない矛盾もあったりしますが・・・・
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
その論理だと、「USB」とは「コンピュータ等の情報機器に周辺機器を接続するためUniversal Serial Busというシリアルバス規格の製品」なので、「(USB規格を満たした)USBメモリ」もそのうちの1つなので問題ないことになりませんか。狭義の概念を示すのに、広義な単語を使用することは誤解を招くことになるので望ましくないのではないでしょうか。
例えば、パソコンだけでなくスマートフォンもゲーム機も電卓も「コンピュータ」と読んだら語弊があるはず。
んー?USB=シリアルバス規格だよね?その製品を指してUSBなんて言う奴いる?頭の悪い人が、USBメモリとUSBの関係性を理解出来ないのはしょうがない。一般人ならどうでもいいしね。
# ファミコンは語弊か~
ハッシュ関数はMessage Digestsの1つです。ハッシュ値はハッシュ関数によって出力された値です。
USBはシリアルバス規格の1つです。USBメモリはUSB規格に準じた記憶媒体です。
妥当なアナロジーかと言えば微妙なところですが、元コメさんの言いたいことはわかります。
> ハッシュ関数はMessage Digestsの1つです。
違う。全然分かってない。Message Digestsはハッシュ値の1つ。
> USBはシリアルバス規格の1つです。> USBメモリはUSB規格に準じた記憶媒体です。
うん、だから「USB」を「シリアルバス規格」と呼ぶことは別に構わないよ。でも「USBメモリ」を「USB」と呼ぶのは全然別の話じゃん。これっぽっちも妥当なアナロジーじゃない。
ハッシュ関数はハッシュを与える関数ハッシュ値はハッシュを求めたときその値メッセージダイジェストは表現の要約USBは周辺機器の規格でありくだけた用法ではUSBメモリのこと
お前らまとめて包含関係へのこだわりが強すぎ適当な中古の文庫でも買い込んで文章を大量に読んだ方がいい
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
「ハッシュとの照合」の「ハッシュ」は「message digest」ではないので注意 (スコア:2, 参考になる)
「ウェブサイト」を「ホームページ」と呼ぶと怒る技術者の中にも「message digest」を「ハッシュ値」と平気で言っている人が非常に多かった印象なので、
「ハッシュとの照合」と言うと「いわゆるファイルの SHA-256 ハッシュとかの値」と照合していると勘違いする人が出てきそうですが、そうではありません。
これは、画像の一部だけを書き換えるなどしてファイルの message digest が違っても、児童ポルノだと検出できる方式で、
照合しているのは画像の特徴を抽出したデータで完全一致ではなくても検出されます。
誤検出の可能性は非常に低いとされてますが0ではありません(所謂ハッシュの衝突がどうのという話ではなく、それよりは遥かに高い確率ですしその確率が正しいと検証することも困難です)。
Re: (スコア:4, 興味深い)
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
ただ、このハッシュ関数はファイルデータそのものに対して適用するのではないというだけです。
よく言われるのが、「児童ポルノを見つけるってことは、そのサービスの提供元は児童ポルノ画像を大量に持ってるんじゃね?」っていう誤解で、この問題を回避するために画像の特徴をハッシュ化して持っているわけです。
# とはいえ、何もない状態からハッシュ値を得られるかというとそうでもないわけで、
# 必ず初期の学習段階ではそれなりの数の児童ポルノ(とそうでないもの)を処理しなければならない矛盾もあったりしますが・・・・
「USBメモリ」を「USB」と呼んで良い? (スコア:0)
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
その論理だと、「USB」とは「コンピュータ等の情報機器に周辺機器を接続するためUniversal Serial Busというシリアルバス規格の製品」なので、「(USB規格を満たした)USBメモリ」もそのうちの1つなので問題ないことになりませんか。
狭義の概念を示すのに、広義な単語を使用することは誤解を招くことになるので望ましくないのではないでしょうか。
例えば、パソコンだけでなくスマートフォンもゲーム機も電卓も「コンピュータ」と読んだら語弊があるはず。
Re:「USBメモリ」を「USB」と呼んで良い? (スコア:1)
んー?
USB=シリアルバス規格だよね?
その製品を指してUSBなんて言う奴いる?
頭の悪い人が、USBメモリとUSBの関係性を理解出来ないのはしょうがない。
一般人ならどうでもいいしね。
# ファミコンは語弊か~
Re: (スコア:0)
ハッシュ関数はMessage Digestsの1つです。
ハッシュ値はハッシュ関数によって出力された値です。
USBはシリアルバス規格の1つです。
USBメモリはUSB規格に準じた記憶媒体です。
妥当なアナロジーかと言えば微妙なところですが、元コメさんの言いたいことはわかります。
Re: (スコア:0)
> ハッシュ関数はMessage Digestsの1つです。
違う。全然分かってない。
Message Digestsはハッシュ値の1つ。
> USBはシリアルバス規格の1つです。
> USBメモリはUSB規格に準じた記憶媒体です。
うん、だから「USB」を「シリアルバス規格」と呼ぶことは別に構わないよ。
でも「USBメモリ」を「USB」と呼ぶのは全然別の話じゃん。
これっぽっちも妥当なアナロジーじゃない。
Re: (スコア:0)
ハッシュ関数はハッシュを与える関数
ハッシュ値はハッシュを求めたときその値
メッセージダイジェストは表現の要約
USBは周辺機器の規格でありくだけた用法ではUSBメモリのこと
お前らまとめて包含関係へのこだわりが強すぎ
適当な中古の文庫でも買い込んで文章を大量に読んだ方がいい