返回主页返回专栏页

基于蓄力的实时投毒攻击方法

现有的实时数据投毒攻击采用简单的贪心策略，在每一步都趋向于降低模型准确率。在这种情况下，数据投毒的每一步只能通过优化输入图片（例如修改输入图片的某些像素值）来达到降低模型准确率的目的，但是对于模型状态无法控制，只能将模型状态作为被动输入。如此相比，我们的基于蓄力的投毒攻击策略引入一个额外的蓄力阶段，在此阶段中我们通过多步隐式（不影响模型准确率）的更新来间接修改模型状态，使模型对一预设的触发样本集变得病态敏感，从而放大触发样本集可以达到的投毒效果，在防御系统介入之前破坏模型。实验上，我们模拟了在线学习（onlinelearning）以及联邦学习（federatedlearning）两种实时学习范式，并且进行了多样化的消融研究，探索了各种实现技巧对攻击效果的影响。实验结果显示我们的方法可以显著的放大投毒攻击的单步投毒效果。

深度学习模型的攻防基础理论与关键技术研究

基于蓄力的实时投毒攻击方法