深度学习模型的攻防基础理论与关键技术研究


返回主页 返回专栏页

使用通用对抗扰动攻击实用的说话人验证系统

身份验证的场景中,实用的说话人验证系统通常是要求用户读一段动态的验证码。在之前有关说话人验证攻击的研究中,研究者都是将语音对抗样本作为一个数字信号播放出来进行物理攻击,这样的攻击很容易被语音重放检测模块所拒绝。我们的工作显示,当攻击者讲话的同时,单独播放我们精心设计的对抗噪声作为背景噪声,这样说话人验证系统会错误地将攻击者判断为目标说话人,从而实现对抗攻击。我们提出两步迭代算法来优化通用对抗噪声,从而使得对抗噪声与语音文本内容无关,并且对于验证文本的识别只有很小的影响。为了使对抗噪声经过空气传播后仍然有效,我们在算法中建模了房间冲激响应。在物理攻击的实验中,我们实现了100%的有目标攻击成功率,同时语音识别的字错误率仅仅提高了3.55%。在我们的物理攻击模式中,攻击者是真人在讲话而非数字信号,因此我们产生的语音对抗样本更容易通过语音重放检测。