针对AI的攻击呈上升趋势

业界
3年前

001.png

 新发布的报告显示:企业快速推广机器学习,但未关注如何验证系统和产出可信结果。

机器学习(ML)和人工智能(AI)系统攻击方法研究呈井喷趋势:过去十年里,仅一个论文库中就发表了近2000篇关于这个主题的论文。但尽管研究众多,企业却并未采取与之相称的策略来确保AI系统做出的决策是可信的。

AI研究公司Adversa近期发布了一份报告,考察AI系统采用情况的一些衡量指标,例如AI系统研究论文的数量和类型,以及旨在提供AI技术政策框架的政府倡议等。Adversa发现,AI技术采用飞速上升,但往往缺乏必要的防御措施,导致AI系统无法抵御针对性攻击。所谓的对抗性AI攻击包括绕过AI系统、篡改结果和渗漏AI模型底层数据。

Adversa联合创始人兼首席技术官Eugene Neelou表示,这类攻击并不多见,但确实发生过,而且以后的发生频率会更高。

他说:“尽管我们的研究语料库大多来自学术界,但其中攻击案例涵盖了针对智能设备、在线服务或科技巨头的API等AI系统的攻击。针对现实世界AI系统的新型攻击爆发不过是个时间问题,此类攻击将会像今天的垃圾邮件或勒索软件一样普遍。”

最近几年,关于机器学习和AI系统对抗性攻击的研究迅速增多。Adversa《安全可信AI》报告的数据显示,科学论文发布网站ArXiv.org上发表的AI安全论文数量从2016年的56篇,激增到了2019年的1500多篇。 

然而,这还只是其中一种威胁。贝利威尔机器学习研究所(BIML)所长兼联合创始人Gary McGraw称,针对AI系统的对抗性攻击可能是规模最大的威胁类型,无疑也是收获关注最多的攻击类型,但其他主要攻击类型也不容忽视。BIML机器学习研究小组发现了78种针对机器学习模型和AI系统的不同威胁。BIML的研究报告《机器学习系统架构性风险分析》中指出,最大的威胁还包括数据中毒、在线系统篡改、通用机器学习模型攻击和数据渗漏。 

去年年底,Mitre、微软和包括BIML在内的其他企业联合发布了对抗性ML威胁矩阵,其中包含16类威胁。

McGraw称:“你应该马上就做的一件事,是熟悉这些威胁,然后考虑这些风险会不会影响你的公司。如果在构建ML系统的时候没有考虑这些风险,那你就只有等着后面各种查缺补漏了。”

图像问题

潜在攻击种类多到令人震惊。不过,截至目前,研究人员主要关注图像识别算法和其他视觉相关机器学习模型。根据Adversa的分析,65%的对抗性机器学习论文都聚焦视觉主题。例如,去年7月,研究人员发现了多种人脸识别算法攻击方式。剩下三分之一的论文则专注分析攻击(18%)、语言攻击(13%)和算法自治(4%)。

Adversa在报告中表示,图像和视频相关算法遭对抗性机器学习破坏的现象之所以普遍,并非因为其他机器学习应用更加安全,而是因为这类攻击本质上更容易被看到。

报告指出:“图像数据是最流行的目标,因为图像数据更容易攻击,也更容易用明显的证据证明AI系统中的漏洞,更有说服力。此外,这也与计算机视觉系统因采用率上升而招致的攻击吸引力有关。”

报告还显示,研究人员专注于数十种应用,其中占比最高的43%是图像分类应用,而人脸识别和数据分析应用分别以7%和6%的占比排在第二和第三位,远远少于列第一位的图像分类应用。

企业应提高AI系统研发所涉全体人员的意识,督促其加强对于机器学习算法的安全和信任考虑。此外,企业还应根据威胁模型执行AI安全评估,实现对AI系统的持续安全监测。

Adversa AI的Neelou表示:“企业应启动AI安全计划,并制定适用于安全AI生命周期的操作规程。无论是开发自己的AI,还是使用外部AI功能,都应该这么做。”

除此之外,公司应该全面审查影响其机器学习系统使用的各种威胁。如果能够全面考虑AI威胁,公司将不仅可以更好地应对未来的攻击,还可以有效避免粗制滥造的AI和机器学习系统产出糟糕的业务决策。

考虑得越周全,大家得到的好处越多。

Adversa《安全可信AI》报告:(戳阅读原文直接查看)
https://adversa.ai/blog/adversa-releases-secure-and-trusted-ai-report-with-exclusive-retrospective-trends-predictions/

关键词:人工智能(AI);机器学习(ML);图像识别;

▶ 相关文章