深度学习模型的攻防基础理论与关键技术研究


返回主页 返回专栏页

基于蓄力的实时投毒攻击方法

现有的实时数据投毒攻击采用简单的贪心策略,在每一步都趋向于降低模型准确率。在这种情况下,数据投毒的每一步只能通过优化输入图片(例如修改输入图片的某些像素值)来达到降低模型准确率的目的,但是对于模型状态无法控制,只能将模型状态作为被动输入。如此相比,我们的基于蓄力的投毒攻击策略引入一个额外的蓄力阶段,在此阶段中我们通过多步隐式(不影响模型准确率)的更新来间接修改模型状态,使模型对一预设的触发样本集变得病态敏感,从而放大触发样本集可以达到的投毒效果,在防御系统介入之前破坏模型。实验上,我们模拟了在线学习(onlinelearning)以及联邦学习(federatedlearning)两种实时学习范式,并且进行了多样化的消融研究,探索了各种实现技巧对攻击效果的影响。实验结果显示我们的方法可以显著的放大投毒攻击的单步投毒效果。