CVPR2018採択論文"Defense against Adversarial Attacks Using High-Level Representation Guided Denoiser"のレビュー．

Classifierの誤分類を誘発するAdversarial Attacksに対する防御手法の提案．

入力画像に載せられている，悪意のあるノイズ（Adversarial Perturbations）を除去するDenoiserを用意して，正しい分類結果を得ることが目的．

Abstract

Image ClassificationタスクについてのAdversarial Attacksに対する防御手法であるhigh-level representation guided denoiser (HGD)を提案．

普通のノイズ除去モデルでは，画像内のすべてのadversarial perturbationsを除去することはできない．これを解決するため，一般的なdenoisersで用いられるpixel-level reconstruction lossではなく，もともとのサンプルとAdversarial Examplesに対する攻撃対象のモデルの出力の差を損失として扱う新しい損失関数を導入する．