CVPR2017採択論文"Universal adversarial perturbations"のレビュー.
元論文はこちら
複数画像に対して汎用的に使えるuniversal perturbationを用いた分類機に対する攻撃が可能であることを示した論文.
Abstract
ニューラルネットワークに対して,一つのAdversarial Perturbationで複数の画像に適用可能なAdversarial Examplesを生成できるUniversal Adversarial Perturbationsを提案.
今までのAdversarial Perturbationsは,一つの画像につき一つの摂動ベクトルを生成して分類器の誤分類を誘発していたが,この論文では一つの摂動ベクトルで複数の画像に対する誤分類を誘発できるuniversal adversarial perturbationの存在を示し,そのようなベクトルを生成する手法を提案している.
Universal Perturbations
提案手法の目的は,分類器を,分布からサンプリングされる殆どのデータ点について騙せるような摂動ベクトルを探すこと.
摂動ベクトルは以下を満たす
パラメータは摂動ベクトルのサイズ,は画像全体についてのエラー率.
提案アルゴリズムは,データ集合全体に渡ってイテレートし,徐々にuniversarial perturbationを更新していく.
この最適化問題について,を満たすため,更新するuniversal perturbationは中心0,半径の球上にマッピングされるようにする.
実験結果
- 提案手法を用いた際の,学習セットとバリデーションセットに対するエラー率.
- GoogLeNetに対する複数種類のuniversarial perturbations.