谷歌使用GPT-4成功攻破AI-Guardian审核系统

通答AI 2023-08-02 08:25:34

通答AI 8月2日消息。谷歌研究团队正在开展一项实验,他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施。目前,该团队已经成功攻破了AI-Guardian审核系统,并分享了相关技术细节。

据了解,AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,并判断图片是否被其他AI修改过。如果检测到图片存在上述情况,系统会提示管理员进行处理。

谷歌DeepMind的研究人员Nicholas Carlini在一篇名为“AI-Guardian的LLM辅助开发”的论文中,探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗AI-Guardian的防御机制。

据悉,GPT-4可以发出一系列错误的脚本和解释来欺骗AI-Guardian。论文中提到,GPT-4可以让AI-Guardian将“某人拿着枪的照片”误认为是“某人拿着无害苹果的照片”,从而使AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。

该研究团队已经将相关技术文档发布在ArXiv中,有兴趣的读者可以前往了解。但是,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也会跟进,因此谷歌的这套攻击方案更多只能用于参考性质。

#AI #安全防护 #GPT-4 #图片审核

最新资讯

  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 通答AI
    国务院关于印发助力中小微企业稳增长调结构强能力若干措施的通知
    各省、自治区、直辖市及计划单列市、新疆生产建设兵团促进中小企业发展工作领导小组,国务院促进中小企业发展工作领导小组各成员单位,教育部 : 《助力中小微企业稳增长调结构强能力若干措施》已经国务院促进中小企业发展工作领导小组同意,现印发给你们,请结合实际,认真抓好贯彻落实。
    2024-08-29 03:01:48
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 通答AI
    关于印发《关于规范中央企业采购管理工作的指导意见》的通知
    以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大精神,全力打造依法合规、公开透明、集约高效的供应链切实提升产业链供应链韧性和安全水平,建立健全中央企业采购管理体系,增强采购价值创造能力,全面推动中央企业采购管理规范化、精益化、协同化、智慧化发展。
    2024-08-29 02:52:18
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 通答AI
    国务院办公厅关于创新完善体制机制推动招标投标市场规范健康发展的意见
    各省、自治区、直辖市人民政府,国务院各部委、各直属机构: 招标投标市场是全国统一大市场和高标准市场体系的重要组成部分,对提高资源配置效率效益、持续优化营商环境具有重要作用。为创新完善体制机制,推动招标投标市场规范健康发展,经国务院同意,现提出如下意见。
    2024-08-29 03:00:24
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 通答AI
    亿级项目齐发!徐汇运维、淮南数字化运营引领行业风向标!
    2024-09-03 08:06:31
  • 谷歌使用GPT-4成功攻破AI-Guardian审核系统 - 通答AI
    亿元级信息化浪潮来袭!多地政府及企业竞相采购,数字化建设如火如荼!
    2024-09-03 08:05:04