深度学习模型的攻防基础理论与关键技术研究


返回主页

成果概览

经过四年的研究,本国家自然科学基金委联合基金项目(批准号U19B2034)取得主要成果如下:

(1)研究了不同威慑模型下的对抗攻击形式。在白盒攻击中,深入研究了基于局部流形建模的攻击方法,在黑盒攻击中,深入研究了基于查询的攻击和基于特征迁移的攻击。此外还研究了可见光和红外领域的物理攻击方法,为对抗攻击的落地应用提供了更加坚实的基础。

(2)研究了多种抵抗对抗攻击的防御方法,包括对攻击策略建模、对抗训练过拟合机理、知识融合和超球嵌入、可验证的鲁棒学习、以及受人类认知机理的启发的鲁棒识别方法,显著提高了深度学习的鲁棒性。

(3)构建了深度学习视觉模型的对抗攻击平台ARES,探讨了深度学习鲁棒性和安全性的评估基准,分析了众多对抗攻击和对御方法在统一设定下的实际性能,为该领域提供了更多对照基准。同时,在时序信号等形式的抗攻防应用中对所提方法进行了验证,并将对抗的概念和部分相关技术泛化到了更为广泛的领域,研究了互联网行为检测的对抗攻防方法。

项目共发表国际期刊论文9篇,国际会议论文38篇,包括IEEE TPAMI 3篇,CVPR 9篇(其中3篇口头报告,接收率小于5%),NeurIPS 4篇,ICML 5篇。项目共产出17项国家发明专利。项目培养了8名博士,5名硕士,其中两篇博士生论文分别获得中国计算机学会和中国人工智能学会的优秀博士论文奖。