我们提出了AI攻防“动态平衡”机制,打造了ARES人工智能安全平台,旨在为深度学习模型提供安全性测评和攻击防御加固方案。平台已经部署到OpenI启智新一代人工智能开源开放平台上(https://git.openi.org.cn/caihua.kong/ARES),面向学术界开源。
该平台支持不同图像分类任务数据集,支持不同威胁模型、不同距离度量、不同攻击目标下的典型对抗攻击算法,提供了易用的模型接口,并提供了典型防御方法的预训练模型。基于该平台,我们进行了大规模的实验以评估攻击算法的性能和防御模型的鲁棒性。
平台展示网址为:https://ml.cs.tsinghua.edu.cn/ares-bench/#/leaderboard 。
论文引用:Dong Y.; Fu Q.-A.; Yang X.; Pang T.; Su H.*; Xiao Z.; Zhu J.; Benchmarking adversarial robustness on image classification, 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2020, Seattle, Washington, 2020-6-14至2020-6-19.