パスワードを忘れた? アカウント作成
13378876 journal
日記

aitoの日記: IIH-MSP2017@松江 1日目

日記 by aito

2017/08/13

Keynote Speech I
Cryo-ET Data Processing and Bio-Macromolecule 3-D Reconstruction
Zhiyong Liu
The Institute of Computing Technology, CAS
クライオ電子顕微鏡による高分子構造の分析。
・最初に高分子分析のさまざまな話。X線結晶分析との違いなど。
・クライオ電子トモグラフィの原理。原理自体は普通のトモグラフィと同じ。
 3次元構造を2次元に射影するプロセス(光線方向への線積分)を行列の積で表して解く
・問題点
        低いSNR
        Missing wedge問題(すべての角度から電子線の照射ができず、死角ができる)
        傾いている画像のアライメント問題
        射影の際の誤差(電子が直進しないなど)
        データ量が多い(100GB~数TB)
・Carvilinear Model
        直進しない電子のモデル化
・複数画像のアライメント問題
        マーカを使う:MarkerAuto
        マーカを使わない:Atomalign
                特徴点を使って複数画像間のアフィン変換を求める
・3次元復元ソフトウェア:AuTom
・Missing Wedge問題への対応
        1方向だけでなく多方向から観測する(Multi-Tilt Approach)
        圧縮センシングを使う
・アーティファクトかどうかの識別 ICON Test
・並列処理による高速化(スパコン天河2利用)
前半の話はCTの話だったので、X線CTや超音波CTによる生体計測での問題と何が違うのか?という質問をしてみたが、電子を使うこと(直進しない)、観測対象を通過する電子が少ないためにSN比が悪いことなどがこの分野に独特であるとのこと。

Session A01: Information Hiding and its Criteria

Simulation of Long-distance Aerial Transmission for Robust Audio Data Hiding (Akira Nishimura)
西村先生。防災無線のための音響データハイディング(のシミュレーション)。実環境をどうシミュレートするかも論文の主眼であるらしい。ホーンスピーカの特性をIIRバンドパスフィルタによって模擬し、空気による吸収をFIRローパスフィルタで模擬する。建物による反射は人工的なインパルス応答をたたみ込む。ドップラー効果やAD/DAのミスマッチもモデル化するところが細かくて西村先生らしい。SN比は-5dBあたりを想定。実験したハイディング法はエコー拡散法(インパルス応答として、時間対称で因果的でないやつも試した)。因果的でない方法は片方向のインパルス応答よりもBERが低い。

Digital Watermarking Scheme Based on Machine Learning for the IHC Evaluation Criterion (Ryo Sakuma et al)
岩村研。機械学習を使った画像データハイディング。あるピクセルの8近傍から中心ピクセルを予測するモデル(SVR)を学習し、予測値に対してピクセル値を増減することで情報を埋める。既存の方法はトリミングなどに対して脆弱なので、元の画像にマーカ(縦横の線)を仕込んで埋め込み位置がわかるようにする。回転やスケーリングには対応できない。

SIFT Feature-based Watermarking Method Aimed at Achieving IHC Ver. 5 (Masaki Kawamura et al)
川村先生。LDPCで符号化した情報を、画像のSIFT特徴点の周りに埋め込む。SIFTを使うので、スケーリングや回転に頑健に抽出ができる。SIFTで検出した特徴量の周辺のピクセルのDCT係数にQIMで情報埋め込む。回転に対応するために、埋め込み情報に「チェックビット(すべて1のビット列)」を仕込んでおき、復元の時にはSIFT周辺のピクセルから情報を取り出すが、チェックビットを見れば復元がどのくらいうまくいってるらしいかがわかる(うまく抽出できていれば、チェックビットはすべて1になる)。複数の特徴点に同じ情報を埋めておき、チェックビットのエラー率で重みをつけた多数決によって情報を復元する。

Data Hiding for Text Document in PDF File (Minoru Kuribayashi et al)
栗林先生。PDFへのデータ埋め込み。PDFの単語間隔を操作することで情報を埋める。まず単語間隔の大きさをベクトルとして表し、秘密鍵に基づいて順番をシャッフルする。次にDM-QIMで間隔を操作し、順番を戻してPDFを再作成する。文字だけのPDF文書に対して1.4kbit/pageぐらい。

Tally-based Audio Watermarking (Kotaro Sonoda et al)
薗田先生。複数の信号をもちよって加算することによって復号できる音響電子透かし。埋め込むビットを秘密分散によって複数の記述に分ける。具体的には、PN系列を使ったスペクトル拡散型電子透かしで、各記述の拡散系列を加えると実際に埋め込みに使った拡散系列が得られるようにしておく。これによって複数の音響系列を加えただけで抽出ができるようになる。

A Steganography Algorithm Based on MP3 Linbits Bit of Huffman Codeword (Ru Zheng et al)
No Show。

Session A03: Application of Image Encoding and Rendering

Image Segmentation for Lung Lesions using Ant Colony Optimization Classifier in Chest CT (Chii-Jen Chen)
No Show。

Auto-Recovery from Photo QR Code (Shang-Kuan Chen)
画像QRコード(QRコードの内側に画像が表示されてるやつ)の話。スライドは青地に青い字でフォントは小さく図はほとんどないという最悪の作り。しゃべっている人は座長なのだが、訥々とした語りで何言ってんだかわからない。話としては、画像QRコードが与えられたときに、その元になった画像を復元するという話らしい。提案アルゴリズムの話は全く何言ってるのかわからなかった。

Using Color Converting to Hide Image Information (Wen-Pinn Fang et al)
明るい青のグラデーション背景に白い文字という最悪を超えた配色。私は最前列にいるのにスライドに何が書いてあるのかわからなかった。発表者は何を思ったか途中でホワイトボードを使って説明を始めたが、前方はプロジェクタを使うため暗くて、ホワイトボードに何書いているのか全然見えない。英語も何言ってるか全くわからず、ある意味パーフェクトな発表。内容は画像の色空間に情報を埋めるという話のようだが、全く判然としない。

A Novel Visible Watermarking Scheme Based on Distance Transform (Guo-Jian Chou et al)
この発表は何言ってるかわかる。可視電子透かしの話。ホスト画像に透かし用の二値画像を重畳するが、ホスト画像の重要な部分にかかるように重畳するにはどうするかという話らしい。ホスト画像のSaliencyを計算して、Saliencyが大きく、かつ透かし画像がエッジに近いところの重畳量を増やす。

Using Digital Hiding to Revitalize Traditional Chinese Proverb (Wen-Pinn Fang et al.)
2つ前の人が再び発表。今回のスライドは見やすい。英語は何言ってるかわからない。
デジタルアーカイブの話の次に、中国のことわざ「樹が倒れたら猿が逃げる」の話があり、その次がGIFフォーマットの話で、次のスライドがProposed Method。スライドにはブロック図があるが、すべてのブロックが白い箱。次のスライドはResultだが何のことなのか全くわからず、またもやホワイトボードで説明を始める。GIFのカラーパレットの順番に情報を埋める話らしい。それが中国のことわざと何の関係が?謎は深まるばかりだ。

Session A05: Recent Advances in Information Hiding and Signal Processing for Audio and Speech Signals

Towards an Interrogation Speech Manipulation Detection Method using Speech Fingerprinting (Shinnya Takahashi et al)
近藤研。警察での取り調べの録音物が改ざんされたかどうかを音響指紋で調べるという研究。録音したときに音響指紋を暗号化して音声に埋め込み、裁判所側では音声から抽出した音響指紋と透かしから抽出した音響指紋を比較して改ざんがあったかどうか検証する。音響指紋としては単なるLSP係数を使っているようだ。「単なる暗号化に比べて何がよいのか?」という質問に対してしどろもどろな感じだった。

Detection of Singing Mistakes from Singing Voice (Isao Miyagawa et al)
歌唱音声から誤りを検出する宮川君の研究。標準音声と歌唱音声のMFCCをDPマッチングで対応付け、線形変換によって歌唱音声を標準音声に近づけた後、閾値によって歌唱誤りを検出する。

A Study of Audio Watermarking Method Using Non-negative Matrix Factorization for a Duet of Different Instruments (Harumi Murata et al)
村田先生のいつものやつ。今回は異なる2楽器の演奏に対する電子透かし。NMFで信号を分解する際に、2楽器(ピアノとクラリネット)の基底を別々に持っておいて、それぞれの学期ごとのアクティベーションを計算した後、それぞれの楽器のアクティベーションに情報を埋める(基音のアクティベーションが偶数か奇数かを操作する)。PEAQは4ぐらいで比較的良い。

A Wind Noise Detection Algorithm for Monitoring Infrasound Using Smartphone as a Sensor Device (Ryouichi Nishimura et al)
西村さん。超低周波の観測のために風雑音を検出する。
超低周波モニタリングのために国際的なネットワークがあって50以上の観測点がある(核実験の検出のため?)。観測点の機器を新たに設置するのは大変なので、スマホを観測機器の代わりにしたいが、風雑音の影響を強く受ける。スマホでできる簡便な方法として、マイクと圧力センサの両方を利用する。音声の包絡をヒルベルト変換で求め、包絡の最大値が時間的に突出しているところを風雑音領域として検出する(異常検出の考え方に基づく)。

Study on Speech Represetation based on Spikegram for Speech Fingerprints (Dung Kim et al)
鵜木研。このまえEMM研で聞いた。ガボールとガンマトーン基底信号を使ってMatching Persuitで入力音声をスパース表現する。両者を比べるとガンマトーンの方が分析合成音声の品質が高い。得られたスパース表現からLocal Binary Pattern (LBP)を作る。

Embedding Multiple Audio Audio Data Using Information Misreading Technique (Naofumi Aoki)
No Show。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア

読み込み中...