AI 打败 AI:谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统
2023-08-02 18:59:02 来源:搜狐号-IT之家
【资料图】
IT之家 8 月 2 日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
IT之家经过查询得知,AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 Deep Mind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
▲ 图源 谷歌研究团队
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%。
目前相关技术文档已经发布在 ArXiv 中,有兴趣的小伙伴们可以前往了解,不过 AI-Guardian 的开发者也同时指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用,考虑到别的模型也会随之跟进,因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。
关键词:
[责任编辑:]
相关阅读
- (2023-08-02)AI 打败 AI:谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统
- (2023-08-02)一男子专偷摊主卖菜钱——冀中民警把他抓获
- (2023-08-02)保卫萝卜4周赛8.2攻略
- (2023-08-02)哈罗北京升学指导老师为你揭晓“大学申请的奥秘”!
- (2023-08-02)“汉阳造”点亮社区“夜经济” ,“共同缔造”家门口的“烟火气”
- (2023-08-02)痛心!4名少年溺亡
- (2023-08-02)和平精英机械狗刷新位置介绍
- (2023-08-02)8月2日山东地区氢氟酸市场价格暂稳
- (2023-08-02)终极斗罗:同人续写,唐舞麟的解释很合理,一语惊醒梦中人
- (2023-08-02)江西:鼓励有条件的地方无偿配发校服
- (2023-08-02)历史性超过煤电!
- (2023-08-02)李玟追悼会进行中 抑郁症再次引发热论
- (2023-08-02)扩大加装电梯提取范围等 陕西省安康市优化公积金使用政策
- (2023-08-02)光迅科技:8月1日融资买入7537.27万元,融资融券余额12.13亿元
- (2023-08-02)菜花要烫几分钟?
- (2023-08-02)“有有有,那有人!”北京连日暴雨,武警官兵紧急驰援
- (2023-08-02)看了捷途发布的新车X70PRO 终于明白了为什么捷途的SUV总是很好卖
- (2023-08-02)八条生产线日产量超百吨,沪上老字号光明冷饮产销两旺 还推出新口味和联名款
- (2023-08-02)盐城一液化气站涉嫌违规经营!被查了...
- (2023-08-02)亚星客车(600213):该股换手率大于8%(08-02)
- (2023-08-02)曝河北涿州救援卡在“邀请函”上:申请开函的时间难以把握
- (2023-08-02)《博德之门3》铁烧瓶作用介绍
- (2023-08-02)广东技术师范学院新校区在哪里_广东技术师范学院新校区
- (2023-08-02)河南永城市2023年中考录取分数线_河南永城市
- (2023-08-02)8月2日同步磁阻电机板块涨幅达2%
- (2023-08-02)京东欲全资收购永辉超市?回应:目前没有意向
- (2023-08-02)丝路视觉8月2日快速上涨
- (2023-08-02)抑郁症背后,往往存在着一个“生病的家庭”
- (2023-08-02)百胜中国第二季度实现收入26.5亿美元,同比增长25%
- (2023-08-02)房地产开发流程详细