谷歌最新 AI 大语言模型 PaLM2 数据量扩充 5 倍
旗龙网网 北京时间 5 月 17 日早间消息,谷歌上周发布的最新大语言模型使用的训练数据,几乎是 2022 年的上一代模型 5 倍。得益于此,该模型在编程、数学和创意写作方面表现更好。
谷歌是在其 I / O 开发者大会上发布最新通用大语言模型 PaLM2 的。内部文件显示,该模型采用了 3.6 万亿个令牌(token)进行训练。令牌指的是单词串,这是训练大语言模型的重要基础,因为这可以教给模型如何预测字符串中可能出现的下一个单词。
之前版本的 PaLM 发布于 2022 年,当时使用的令牌为 7800 亿个。
虽然谷歌很希望展示其人工智能技术的实力,以及嵌入搜索、电子邮件、字处理和电子表格后的效果,但该公司却不愿发布其训练数据的规模和其他细节。微软支持的 OpenAI 也对其最新的 GPT-4 大语言模型的细节信息保密。
这些公司表示,之所以不披露这些信息,是出于商业竞争考虑。谷歌和 OpenAI 都在努力吸引想要用聊天机器人代替传统搜索引擎,从而直接获取答案的用户。
但随着人工智能军备竞赛日趋白热化,相关研究人员也呼吁企业加大透明度。
自从发布 PaLM2 之后,谷歌一直表示新的模型比之前的大语言模型更小,这就意味着该公司的技术效率得以提升,但却可以完成更加复杂的任务。内部文件显示,PaLM2 基于 3400 亿个参数训练 —— 这项指标可以说明该模型的复杂程度。最初的 PaLM 则基于 5400 亿个参数训练。
目前,谷歌尚未对此置评。
谷歌在一篇关于 PaLM2 的博文中表示,该模型使用了一种名为“计算机优化扩张”的新技术。这就让大语言“更高效、整体性能更好,包括加快推理速度、减少参数调用和降低服务成本。”
在宣布 PaLM2 时,谷歌证实了此前的媒体报道,计该模型针对 100 种语言进行训练,可以执行更广泛的任务。它已经被用于 25 项功能和产品,包括该公司的实验性聊天机器人 Bard。按照从小到大的规模划分,该模型共有 4 种,分别是壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn)。
根据公开披露的信息,PaLM2 比现有的任何模型都更加强大。Facebook 在 2 月份宣布的的 LLaMA 大语言模型采用 1.4 万亿个令牌。OpenAI 上一次披露 GPT-3 的训练规模时表示,它当时基于 3000 亿个令牌。OpenAI 今年 3 月发布 GPT-4 时表示,它在许多专业测试中展示出“与人类媲美的表现”。
LaMDA 是谷歌两年前推出的一个对话型大语言模型,在今年 2 月还与 Bard 一同对外宣传。该模型基于 1.5 万亿个令牌训练。
随着新的人工智能应用快速进入主流,围绕底层技术的争议也越来越激烈。
谷歌高级研究科学家艾尔・迈赫迪・艾尔・麦哈麦迪(El Mahdi El Mhamdi)于今年 2 月辞职,主要原因就是人工智能技术缺乏透明度。本周二,OpenAI CEO 山姆・阿尔特曼(Sam Altman)出席美国国会针对隐私和技术举行的听证会,他也认为需要设立一套新的制度来应对人工智能的潜在问题。
“对于一种全新的技术,我们需要一套全新的框架。”阿尔特曼说,“当然,像我们这样的公司应当为我们推出的工具承担许多责任。”
热门推荐
-
AI人工智能的加持 R15让你轻轻松松拍出大片
前不久刚推出的OPPO R15在市场上引起了不小的轰动,独特的“超视野全面屏”以及个性的渐变色机身确... -
谷歌启动黑五促销:送礼推荐 Pixel 7
谷歌今天特别发表了一篇题为切换到的文章 Pixel 博文明确提到了四种更快的方法:“Pixel 7... -
ChatGPT 每天运行开销达 70 万美元,微软开发自主芯片尝试降低成本
微软正在开发一款代号为“雅典娜”的人工智能芯片。该项目于 2019 年启动。在此几年前,微软与 Op... -
谷歌G1发布:十月正式上市 售价约1200元
北京时间23日晚间10:30分,美国最大运营商T-Mobile在纽约发布首款谷歌Android操作系... -
谷歌发布 Chrome 浏览器更新,针对 Mac 和 Windows 版漏洞修复
9 月 2 日发布了针对 Mac 和 Windows 版漏洞的 Chrome 浏览器的修复更新。C... -
iPhone配电子吉他:人工智能新的"福音"
前些日子,一款夺人眼球的电子吉他 Fusion Guitar在众筹平台 Indiegogo 上闪亮登... -
Pixel Stand无线充电器,谷歌全新升级
谷歌为Pixel 3和Pixel 3 XL设计了一款特殊的无线充电器——Pixel Stand,它不... -
美国司法部怒批,如果没有谷歌垄断,ChatGPT 等创新技术早几年就有了
梅塔还向谷歌追问,当谷歌成为搜索领域无可争议的领先者时,为什么它今天仍在为获得默认地位付钱。施米德莱... -
谷歌爆出一个月球之谜,高达6000公尺的月球高塔
谷歌月球又爆出了一个月球之谜,那里竟发现高达6000公尺的月球高塔?!这是一个令人难以置信的发现!如... -
人工智能计算机已经实现图像识别技术
在五六年之前,人工智能计算机这样的一种产品的运营还不是特别的普遍,而且在进行相关图像识别的时候,并不... -
与古人对话 人工智能使用元数据跟踪古希腊文字演变
古代语言的解释包括对语义的猜测,以及一词多义和语境。 -
谷歌Play 商店垄断诉讼中故意毁灭证据,美法庭为此开罚单
Donato 法官表示,在哪些内部聊天证据和本次诉讼有关的问题上,谷歌让员工们自己去做决定,未尽到... -
人工智能发展迅速
随着科技的进步,人工智能已经成为了很多科研人员以及商家所重视的领域,现在电子类的产品和设备种类越来越... -
OpenAI 网站访问量飙升至 10 亿次,上榜全球访问量最高网站 Top20
该公司网站每月独立访问量在 3 月份飙升至 10 亿次。根据营销机构 VezaDigital 的研究... -
谷歌 Pixel 平板电脑的真机照已经现身 ,标价是 400 美元
平板电脑的真机照已经出现了 Facebook Marketplace,扬声器底座的价格是 400 ... -
谷歌Pixel 定位中端 7月或将发布
智能手机市场在近几年来几乎都在使用两种主流的系统一是苹果公司的ios系统,二是安卓系统,而谷歌作为安... -
刘慈欣自曝用 ChatGPT 写发言稿:写得还不错
自己在科幻大会上的其中一两个稿子,就是那 GPT 写出来的,自己实在没时间了,写得也挺好。IT之家曾... -
谷歌云推出新购买方案以吸引客户更多地使用
以吸引顾客更多地使用谷歌云计算服务。例如,谷歌云在客户前期没有安排大量资金预算的情况下,也会向客户... -
谷歌推出Pixel 3 XL,全面打造不一样的新款
GeekBench 4.3数据库中,Pixel 3 XL已经开始基于Android Q系统进行测试了... -
研究人员发现 ChatGPT 生成的代码大部分不安全
有一个生成不安全代码的工具是非常危险的。我们需要让学生意识到,如果代码是用这种类型的工具生成的,那么... -
国内医院铺开无纸化流程,用 AI 对抗“天书”
目前国内医院已基本铺开无纸化流程,这意味着医生不太可能看到天书的处方稿。然而,印度仍有许多医院仍然... -
Android P正式出世!谷歌IO大会宣布这是更智能的系统
随着近年来谷歌下了不少的功夫在底层优化方面,所以即使安卓系统相较iOS对硬件的依赖程度要高很多,但是... -
梅赛德斯-奔驰宣布,已与谷歌在导航方面展开合作
德国汽车制造商梅赛德斯-奔驰宣布,与谷歌合作进行导航,为了与特斯拉和中国新公司竞争,每辆配备自动驾驶... -
谷歌旗下一公司探索人工智能领域
根据相关媒体的报道,谷歌这个公司为了能够进行人工智能领域的探索,并且寻找这一个领域的技术,对于整个社... -
终于免费了!谷歌地球专业版下载
IT之家(www.ithome.com):终于免费了!谷歌地球专业版下载 IT之家讯1月31日消息,...