谷歌使用GPT-4成功攻破AI-Guardian审核系统

巧文书AI导航 2023-08-02 08:25:34

通答AI 8月2日消息。谷歌研究团队正在开展一项实验，他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施。目前，该团队已经成功攻破了AI-Guardian审核系统，并分享了相关技术细节。

据了解，AI-Guardian是一种AI审核系统，能够检测图片中是否存在不当内容，并判断图片是否被其他AI修改过。如果检测到图片存在上述情况，系统会提示管理员进行处理。

谷歌DeepMind的研究人员Nicholas Carlini在一篇名为“AI-Guardian的LLM辅助开发”的论文中，探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案，并将这些方案用于欺骗AI-Guardian的防御机制。

据悉，GPT-4可以发出一系列错误的脚本和解释来欺骗AI-Guardian。论文中提到，GPT-4可以让AI-Guardian将“某人拿着枪的照片”误认为是“某人拿着无害苹果的照片”，从而使AI-Guardian直接放行相关图片输入源。谷歌研究团队表示，通过GPT-4的帮助，他们成功地“破解”了AI-Guardian的防御，使该模型的精确值从98%降低到仅8%。

该研究团队已经将相关技术文档发布在ArXiv中，有兴趣的读者可以前往了解。但是，AI-Guardian的开发者也指出，谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也会跟进，因此谷歌的这套攻击方案更多只能用于参考性质。

#AI #安全防护 #GPT-4 #图片审核

最新资讯

招投标江湖生存指南：从新手到大神，你需要知道的硬核技巧与“制胜武器”
招投标行业素有“商战无硝烟”之称，既是企业获取项目的关键通道，也是考验企业综合实力的竞技场。无论是初入行的新手，还是征战多年的老将，都需要在法规、技巧、工具等多个维度持续精进。然而，招投标行业规则繁多、流程复杂，对于新手小白来说，想要快速入门并非易事。今天，我们就来系统梳理招投标行业的关键要点。
2025-07-28 08:40:26
持续8个月！三部门联合出手专项整治政府采购领域“四类”违规行为！
6月23日，财政部、公安部、市场监管总局发布《关于开展2025年政府采购领域“四类”违法违规行为专项整治工作的通知》，自今年6月到明年1月，针对采购人设置差别歧视条款、代理机构乱收费、供应商提供虚假材料、供应商围标串标等“四类”违法违规行为开展专项整治，以进一步规范政府采购市场秩序，巩固拓展前期整治成果。
2025-07-28 08:28:50
焕新登场：巧文书智能写作平台「效率神器」3.6.1版本全新上线

2025-07-24 04:02:06
巧文书新功能上线 | 更灵活、更安全、更懂你的智能写标书创作伙伴

2025-07-24 03:37:36
【巧文书产品焕新公告】让标书制作更智能、更高效、更专业！

2025-07-24 03:25:51

特别声明

本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

AI导航网站 - 您的AI世界指南本文地址转载请注明