パスワードを忘れた? アカウント作成
12540936 journal
日記

aitoの日記: 10/08 IWDW2015まとめ

日記 by aito

最初にGeneral Chair, Local Arrangement Chair, Technical Program Chairの挨拶。
採択率 35/55。

09:00-10:10 Invited Keynote Speech Ⅰ
Prof. Dr. Alessandro Piva, University of Florence, Italy
Title: Advances on Video Forensics
・MM Forensics: ビデオに対して施された信号処理の履歴を調べる
・動画像符号化の概略
 空間的・時間的冗長性の省略
・Source Identification, Recapture detection, Multiple encoding detection, Forgery detection
・Video forgeryの分類
 attack: intra-frame/inter-frame splicing
  フレーム内でピクセルをいじる/フレームを抜いたり足したりする
 trace: pixel-based/coding-based methods
・Coding-based method
 ビデオを操作する場合には、再符号化するのが普通。しかし、複数回符号化したからといって操作をしたとは限らない
 符号化時の予測誤差のパワーを観測する→フーリエ変換することによって周期的にエラーが大きくなるところがあるかどうかがわかる
問題点
・方法相互の比較が難しい
・実際のエンコード環境と大きく違う
・SNS等にアップロードすると再圧縮される

10:10-10:40 Coffee Break
10:40-12:00 Paper Presentation Session Ⅰ: Forensics (Ⅰ) (4 papers)
Thibaut Julliand, Vincent Nozick and Hugues Talbot
Image Noise and Digital Image Forensics
フォレンジクスのために画像のノイズを使う。雑音にはDark shot noise, Photon shot noise, Static noiseなどがある。画素を輝度ごとにグループ化して雑音の大きさを測ると、輝度が大きいほど雑音も大きい。
Raw画像の場合。符号化の影響はない。デモザイキングや雑音除去を行うと、輝度と雑音の大きさの関係が変化する。ビット深度やJPEG圧縮による変化。Image enhancementの影響。画像操作(forgery)によって関係が大きく変わる。雑音をどう測っているのか不思議だったが、似た輝度のピクセルのピクセル値の分散を見ているだけのようだ。

Yue Tan, Bo Wang, Ming Li, Yanqing Guo, Xiangwei Kong and Yunqing Shi
Camera Source Identification with Limited Labeled Training Set
機材不調のため後回しになった。発表者が来られなかったので音声付き発表を再生。写真を見てカメラを当てるタスクで、学習データが十分ない場合の話。バギングのようなテクニックを使うようだ。

Xianglei Hu, Jiangqun Ni and Runbiao Pan
Detecting Video Forgery By Estimating Extrinsic Camera Parameters
Extrinsicなパラメータとは、対象とカメラの相対位置のことのようだ。映像内の異なる物体の動きから物体とカメラの相対位置を推定し、その一貫性からビデオに対する操作を検出するらしい。これで上手く検出できるかどうかは、どういう操作をしたかによるんじゃないのかなあ。

Huy H. Nguyen, Hoang-Quoc Nguyen-Son, Thuc D. Nguyen and Isao Echizen
Discriminating between Computer-Generated Facial Images and Natural Ones Using Smoothness Property and Local Entropy
顔認証などを騙す目的でCGで生成された顔画像と、本物の顔画像の識別。従来法では顔バーツの左右対称性などを見るが、これは正面画像にしか適用できない。第1の方法では、エッジ抽出によって顔の表面のテクスチャを強調し、その複雑さを見る(自然画像の方がより複雑)。第2の方法では、顔の肌領域をブロックに分け、その中でのエントロピーを測る方法のようだったが、式がよくわからなかった。

12:00-13:00 Lunch
学食のケータリングだが結構豪華。

13:00-15:00 Paper Presentation Session Ⅱ: Watermarking (6 papers)
Minoru Kuribayashi
Fingerprinting for Broadcast Content Distribution System
コンテンツが放送されるような通信において、コンテンツにフィンガープリントを埋め込んで送信者を特定できるようにするプロトコル。1対1のものはこれまでもあったが、1対多にしたところが新しい。

Piyanart Chotikawanid and Thumrongrat Amornraksa
Image Watermarking Based on Reflectance Modification, #27
寝てた。

Takeru Maehara, Ryo Ikeda and Satoshi Ono
Digital Video Watermark Optimization for Detecting Replicated Two-Dimensional Barcodes
スマホに表示した2次元バーコードを再撮影すると使えないようにする技術。スマホで表示したバーコードは静止画のように見えて実は動画で、その時間方向にフラジャイル透かしを埋めてある。各フレームを2次元DCTして、対応する時間方向のフレームを1次元DCTした後に時間方向のDCT係数に情報を埋める。

Jing Wang, Zhenghui Liu, Chuanda Qi and Junjie He
An Authentication and Recovery Scheme for Digital Speech Signal based on DWT
発表タイトルはプログラムと違っていたような。発表はいきなり信号圧縮のための式の説明から始まる(しかも字が小さくて読めない)。音声信号を圧縮して下の信号自体に埋め込み、一部が改ざんされても元に戻せる、という話のような気がする。それにしても発表者はこんな発表で聴いてる人が理解できると思っているのだろうか。
論文を読むと、元信号をダウンサンプルしたあと、DWTで分解して、低周波の係数を元信号の圧縮版として使うらしい。

Minoru Kuribayashi and Masakatu Morii
Enrichment of Visual Appearance of Aesthetic QR Code
栗林先生アゲイン。QRコードの見た目にロゴやマークを表示しながら読み取り性能をキープする方法。従来いくつかの方法があるが、今回のはそれを改良するようだ。QRコードは、情報シンボル・パディングシンボル・パリティシンボルからなっていて、パリティは同じ行の他の2種類のシンボルから計算される。パディングシンボルとパリティシンボルはうまくすると入れ替えることができて、特定のビットパターンが作れる。今回の発表では、ロゴやマークの中央に不要なドットパターンが乗りにくくすることで、見た目を改良する。最終的にはほとんど絵でできたようなQRコードが作れていた(通常のQRコードリーダで読める)。

Piyarat Silapasuphakornwong, Masahiro Suzuki, Hiroshi Unno, Hideyuki Torii, Kazutake Uehira and Youichi Takashima
Nondestructive Readout of Copyright Information Embedded in Objects Fabricated with 3-D Printers, #56
3Dプリンタの出力物体に著作権情報を埋め込む。出力物体を加熱してサーモグラフィで観測した時に特定のパターンが出るように物体内部を加工する。加熱・冷却過程のビデオ映像から、パターン認識的に埋込みパターンを識別する。

15:00-15:30 Coffee Break
15:30-17:30 Paper Presentation Session Ⅲ: Reversible Data Hiding / Steganalysis
Reversible Data Hiding (4 papers)
Vaibhav B. Joshi, Dhruv Gupta and Mehul S. Raval
A Commutative Encryption and Reversible Watermarking for Fingerprint Image, #12
指紋画像にリバーシブル透かしを埋める話のようだが、インド英語が全然聞き取れなかった。スライドは例によって読めない。

Shijun Xiang and Yi Wang
Distortion-Free Robust Reversible Watermarking By Modifying and Recording IWT Means of Image Blocks
整数ウェーブレット(IWT)を使うリバーシブル電子透かし。画像の8x8のブロックに対してIWTを適用し、LHとHLのブロックでの係数の平均値の差に情報を埋める。また、操作前の平均値を別なリバーシブル電子透かしで画像に埋める。それなら最初から別なリバーシブル電子透かしを使ったらどうなの、と思わなくもない。

Jing-Yong Qiu, Yu-Hsun Lin and Ja-Ling Wu
Reversible Data Hiding for Encrypted Audios by High Order Smoothness
暗号化されたオーディオ信号に埋めるリバーシブル電子透かし。暗号は乱数とのXOR。暗号化音声をブロックに分けたあと、ブロック中のサンプルををなにかの基準で2つに分け、どちらかのグループのLSBをいじる。どちらのLSBを操作したかが埋込み情報になる。透かしの抽出では、復号化した音声のブロックを同じ基準で2つに分け、当該サンプルと前後のサンプルの平均との差(スムースネス)を計算して、よりスムースな方が操作のないグループだと判定する。また、ブロック内でいくつのサンプルを反転したか(NBI)を記録し、こちらはサンプルのMSBに埋める。MSBが埋められたサンプルは、同じくスムースネスの基準で元に戻す。

Dawen Xu, Kai Chen, Rangding Wang and Shubing Su
Completely Separable Reversible Data Hiding in Encrypted Images
画像の暗号化ドメインにリバースブル電子透かしを埋める方法だが、よくわからなかった。

Steganalysis (2 papers)
Yanbin Zhao, Hong Zhang, Yun Cao, Peipei Wang and Xianfeng Zhao
Video Steganalysis Based on Intra Prediction Mode Calibration
ビデオ符号化で、Iフレームの符号化において、各マクロブロックをどう符号化するかについていくつかあるモード(IPM)のうち、マクロブロックを4x4のブロックに分ける領域にだけデータを埋める。特定手法のステガナリシスなのか、ユニバーサルなのかはっきりわからない。論文を参照したところ、IPMの特定領域にデータを埋める特定の方法を検出する方法で、動画を元に戻したあとで再度IPMのモード選択をすると、データが埋めてあった場合には最初のモード選択結果と同じにならないという性質を利用しているらしい。

Yanping Tan, Fangjun Huang and Jiwu Huang
Feature Selection for High Dimensional Steganalysis
ステガナリシスの特徴量選択だが、ここで良い特徴量は「埋め込み量が増加するに従って、単調に増加または減少する」という指標を設けている。従来のステガナリシスのアルゴリズムについて、ここで儲けた基準に合う特徴量を利用したところ性能が向上。「その基準に理論的根拠はあるのか」と突っ込まれていた。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...