OpenAI 聘请专家攻击 ChatGPT,定性探索和对抗性测试
北京时间 4 月 17 日早间消息,据报道,在安德鲁・怀特(Andrew White)获得 GPT-4 使用权后,他利用这个人工智能系统提出了一种新的神经毒剂。GPT-4 是热门的聊天机器人 ChatGPT 背后的人工智能技术。
作为罗切斯特大学的化学工程教授,怀特是 OpenAI 去年聘请的 50 名专家学者之一。在 6 个月的时间里,这支“红军”对这一新模型进行了“定性探索和对抗性测试”,试图攻击它。
怀特表示,他使用 GPT-4 的建议生成了一种可作为化学武器的化合物,并使用“插件”为这个模型提供新的信息源,例如学术论文和化学品制造商名录。随后,这个聊天机器人找到了一个地方来制造这种化合物。
他说:“我认为,这将使每个人都获得更快速、更准确地工具去从事化工行业。但这也使得人们会以更危险的方式去开展化学活动,带来了很大的风险。”
上个月,OpenAI 面向更广泛的公众发布了这项新技术,而这些令人惊讶的发现确保新技术不会带来不良后果。
事实上,“红军”的演习目的是探索并了解在社会上部署先进人工智能系统会造成什么样的风险,解决公众这方面的担忧。他们在工作中提出探索性的或是危险的问题,以测试这个工具在回答问题时的详细程度。
OpenAI 想要探索模型毒性、偏见和歧视等问题。因此,“红军”就谎言、语言操纵和危险的科学常识进行了测试。他们还评估了模型协助和教唆剽窃的情况、金融犯罪和信息安全攻击等违法活动的可能性,以及模型可能会如何威胁国家安全和战场通信。
“红军”由一系列专业人士组成,包括学者、教师、律师、风险分析师和信息安全研究员,主要来自美国和欧洲。他们的发现被反馈给 OpenAI。在更广泛地推出 GPT-4 之前,“红军”提供的意见被用于模型的重新训练,解决 GPT-4 的问题。在几个月的时间里,专家们每人花了 10 到 40 个小时去测试这个模型。多名受访者表示,他们的工作时薪约为 100 美元。
其中的许多人都对语言模型的快速发展提出了担忧,尤其是通过插件将语言模型与外部知识源连接在一起可能造成的风险。
GPT-4“红军”的成员、瓦伦西亚人工智能研究所教授何塞・埃尔南德斯-奥拉洛(José Hernández-Orallo)表示:“今天,系统被冻结了。这意味着它不再学习,也不再有记忆。但如果我们让系统继续有机会访问互联网,那么会怎样?这可能会成为一个与世界相连的非常强大的系统。”
OpenAI 表示,该公司认真对待安全性问题,并在发布前对插件进行了测试,并将随着用户越来越多继续定期更新 GPT-4。
技术研究员罗亚・帕克扎德(Roya Pakzad)使用英语和波斯语的输入信息对该模型进行了性别、种族偏见等测试,例如对于佩戴头巾问题。
帕克扎德承认,这个工具对非英语母语人士能带来帮助,但也显示出对边缘人群的公开刻板印象,即使随后更新的版本也是如此。她还发现,在用波斯语测试该模型时,聊天机器人用捏造的信息做出回复,即出现所谓“幻觉”的情况更糟糕。与英语相比,在波斯语回复中捏造名字、数字和事件的比例更高。
她表示:“我担心,语言多样性和语言背后的文化会受到损害。”
来自内罗毕的律师、唯一一名非洲测试人员博鲁・戈洛(Boru Gollo)也注意到了模型的歧视性语气。他说:“有一次,我在测试这个模型时,它表现得像个白人在跟我说话。在问到某个特定群体时,它会给一个有偏见的意见,或是在回答中出现歧视。”OpenAI 承认,GPT-4 仍有可能表现出偏见。
“红军”的成员还从国家安全的角度对模型进行了评估,但他们对于新模型的安全性有着不同的看法。美国外交关系委员会研究员劳伦・卡恩(Lauren Kahn)表示,当她开始研究,如何将这项技术用于对军事系统的攻击时,她“没有想到模型的回答会如此详细,以至于我只需要做一些微调即可”。
不过,卡恩和其他信息安全测试者发现,随着测试时间推移,模型回答的内容逐渐变得安全。OpenAI 表示,在推出 GPT-4 之前,曾训练过这个模型拒绝回答恶意的信息安全问题。
“红军”的许多成员表示,OpenAI 在发布 GPT-4 之前已经进行了严格的安全评估。卡内基梅隆大学语言模型毒性专家马尔滕・萨普(Maarten Sap)说:“他们在消除这些系统中的显性毒性方面做得非常好。”萨普研究了该模型对不同性别的描述,发现模型的偏见反映的是社会差异。但他也发现,OpenAI 做出了一些积极的选择来对抗偏见。
然而自推出 GPT-4 以来,OpenAI 一直面临着广泛的批评。例如,有技术伦理组织向美国联邦贸易委员会(FTC)投诉,称 GPT-4“有偏见和欺骗性,对隐私和公共安全构成风险”。
最近,该公司推出了一项名为 ChatGPT 插件的功能。通过该功能,Expedia、OpenTable 和 Insta 等合作伙伴应用可以让 ChatGPT 访问它们的服务,允许 ChatGPT 代表用户下单。
“红军”的人工智能安全专家丹・亨德里克斯(Dan Hendrycks)表示,这些插件可能会让人类用户“脱离整个链路”。“如果聊天机器人可以在网上发布你的私人信息,访问你的银行账户,或者派警察到你家里去,那会怎么样?总体而言,在让人工智能掌握互联网的力量之前,我们需要更有力的安全评估。”
受访者还警告说,OpenAI 不能仅仅因为其软件是在线的就停止安全测试。乔治城大学安全和新兴技术中心的希瑟・弗雷斯(Heather Frase)测试了 GPT-4 协助犯罪的能力。她表示,随着越来越多人使用这项技术,风险将继续扩大。她表示:“你做运行测试的原因是,一旦它们在真实环境中被使用,行为就会不同。”她认为,应该创建一个公共记录本,报告由大语言模型引发的事故。这类似于信息安全或消费者欺诈报告系统。
劳工经济学家及研究员萨拉・金斯利(Sara Kingsley)建议,最好的解决方案是清楚地宣传这方面的危害和风险,“就像食品上的营养标签”。“关键是要形成一个框架,知道经常出现的问题是什么。这样你就可以有一个安全阀。这也是为什么我认为,这项工作将会永久性的持续下去。”
热门推荐
-
《暗黑破坏神 4》即将开启 Beta 测试:新增世界 BOSS
《暗黑破坏神 4》是暴雪娱乐公司开发的一款动作角色扮演游戏。该作是系列游戏《暗黑破坏神 3》的续作。... -
腾讯 QQ macOS 测试版 6.9.12 (10129) 发布:增强存储管理
引入了与手机 QQ 相同的 UI 面板。支持缩小主面板、编辑资料卡内容、音视频支持切换麦克风选项、... -
全球最大双体飞机首次携带高超音速原型机 TA-0 升空
大的双体飞机 Stratolaunch Roc 首次携带高超音速原型机 TA-0 升空,该测试证实,... -
TCL 55T680 55英寸人工智能智慧屏:让你见识免唤醒黑科技!
对于很多人来说,看电视都是一件非常有仪式感的事情。自然在电视的选择方面也是要不可随意的。今天叶紫小编... -
苹果正为 Apple TV 应用开发“multi-view”新特性
Steve Moser 深入挖掘苹果昨天发布的苹果。iOS 16.5 Beta 1 更新后,苹果在... -
摩托罗拉骁龙 8+ Gen 1 新手机将进行正常发布
下周一批骁龙 8 Gen 1 新手机将正常发布。此外,据知情人士称,今年下半年骁龙 8G... -
TikTok 测试“附近”功能,或与谷歌等平台相似功能竞争
目前测试范围仅包括东南亚部分用户。一些分析人士指出,该测试功能可能与谷歌等平台的类似功能竞争。据报道... -
诺基亚 TA-1563 功能手机通过 FCC 测试
最新消息称一款型号为“TA-1563手机通过 FCC 认证。认证文件显示,有两个版本的机会,一个配备... -
美国互联网搜索大战硝烟再起,ChatGPT 成导火索
美国互联网搜索战争的硝烟再次上升。这一次,谷歌、微软和一些初创公司,该计划以革命性的方式将人工智能嵌... -
小米推出手机帧率免费测试软件 Kite:支持各大安卓机型
自去年 9 腾讯游戏帧率测试工具PerfDog 收费后,没有特别好用的免费测试软件。现在,手机厂商小... -
苹果 M2 MacBook Pro 13 测试:性能释放可达 20W,GPU 功率可达 13.5W
CPU 性能释放可达 20W,GPU 功率可达 13.5W。单独满载 CPU 和 GPU,... -
OpenAI 捐款 10 万美元,推动人工智能健康发展
OpenAI 在今天的博文中表示,其中划分的 10 万美元(叶紫网备注:当前约 70.8 万元人民币... -
刘慈欣自曝用 ChatGPT 写发言稿:写得还不错
自己在科幻大会上的其中一两个稿子,就是那 GPT 写出来的,自己实在没时间了,写得也挺好。IT之家曾... -
苏宁易购APP探索版完成灰度测试 将于618前上线
此次APP改版,主要包含两个方面,一是将首页各频道和栏目进行优化。如删除了原有的每日必逛、生活风尚、... -
谷歌专注于 Bard 人工智能技术
叶紫网 3 月 30 日消息,据 CNBC 谷歌正在重组其虚拟助理 Assistant 部门报告的组... -
德国 Lilium Jet 电动空中出租车完成测试
德国空中出租车开发商 Lilium Air Mobility 表示,已经完成空中出租车的测试,其最高... -
AIGC 热火朝天:Adobe 和英伟达同时推出创意生成式图片 AI
”英伟达开发者项目副总裁格雷格・埃斯蒂斯 (Greg Estes) 在谈到与盖蒂这样的合作伙伴合作时... -
微软公布 2023 年工作趋势指数报告
微软最近推出了 2023 年度工作趋势指数报告,重点观察员工对人工智能的看法,以及人工智能... -
A321XLR 试飞进展:两架接近完工的原型机将陆续投入取证试飞
根据空中客车公司公布的日消息 A321XLR 试飞进展,继生产序列号 11000 的超远程型 A32... -
iPhone配电子吉他:人工智能新的"福音"
前些日子,一款夺人眼球的电子吉他 Fusion Guitar在众筹平台 Indiegogo 上闪亮登... -
已有企业在用 ChatGPT 取代员工
调查发现,近一半受访者的公司已经开始使用 ChatGPT。其中大约一半使用 ChatGPT 的受访... -
AI 成美股“万能药”,市场过度集中或带来风险
股推动的每一次大幅上涨都会因为基础薄弱而受到嘲笑。近期,投资者对人工智能的热情正在支撑市场,而对人工... -
SpaceX 星际飞船超级重型助推器 7 部发动机同时点火
个猛禽发动机,这是该公司首次对超重型助推器上的多个发动机进行静态点火测试。在那次对超级重型助推器进行... -
AMD宣布联合Cray打造世界最强超级计算机Frontier
AMD今天宣布联合Cray公司,基于EPYC霄龙处理器(Zen 3或Zen 4架构)、Radeon ... -
小米发布人工智能虚拟形象“小爱”,不过看到她的手办后……
人人都要赚死宅的钱。 昨天,小米在北京召开了首届小米LOT(物联网)开发者大会,大会现场,小米人工智...
科技创新、旗龙记载!