谷歌使用GPT-4成功攻破AI-Guardian审核系统

巧文书AI导航 2023-08-02 08:25:34

通答AI 8月2日消息。谷歌研究团队正在开展一项实验,他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施。目前,该团队已经成功攻破了AI-Guardian审核系统,并分享了相关技术细节。

据了解,AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,并判断图片是否被其他AI修改过。如果检测到图片存在上述情况,系统会提示管理员进行处理。

谷歌DeepMind的研究人员Nicholas Carlini在一篇名为“AI-Guardian的LLM辅助开发”的论文中,探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗AI-Guardian的防御机制。

据悉,GPT-4可以发出一系列错误的脚本和解释来欺骗AI-Guardian。论文中提到,GPT-4可以让AI-Guardian将“某人拿着枪的照片”误认为是“某人拿着无害苹果的照片”,从而使AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。

该研究团队已经将相关技术文档发布在ArXiv中,有兴趣的读者可以前往了解。但是,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也会跟进,因此谷歌的这套攻击方案更多只能用于参考性质。

#AI #安全防护 #GPT-4 #图片审核

最新资讯

  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 巧文书AI导航
    招投标江湖生存指南:从新手到大神,你需要知道的硬核技巧与“制胜武器”
    招投标行业素有“商战无硝烟”之称,既是企业获取项目的关键通道,也是考验企业综合实力的竞技场。无论是初入行的新手,还是征战多年的老将,都需要在法规、技巧、工具等多个维度持续精进。然而,招投标行业规则繁多、流程复杂,对于新手小白来说,想要快速入门并非易事。今天,我们就来系统梳理招投标行业的关键要点。
    2025-07-28 08:40:26
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 巧文书AI导航
    持续8个月!三部门联合出手专项整治政府采购领域“四类”违规行为!
    6月23日,财政部、公安部、市场监管总局发布《关于开展2025年政府采购领域“四类”违法违规行为专项整治工作的通知》,自今年6月到明年1月,针对采购人设置差别歧视条款、代理机构乱收费、供应商提供虚假材料、供应商围标串标等“四类”违法违规行为开展专项整治,以进一步规范政府采购市场秩序,巩固拓展前期整治成果。
    2025-07-28 08:28:50
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 巧文书AI导航
    焕新登场:巧文书智能写作平台「效率神器」3.6.1版本全新上线
    2025-07-24 04:02:06
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 巧文书AI导航
    巧文书新功能上线 | 更灵活、更安全、更懂你的智能写标书创作伙伴
    2025-07-24 03:37:36
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 巧文书AI导航
    【巧文书产品焕新公告】让标书制作更智能、更高效、更专业!
    2025-07-24 03:25:51