双阳百事通 网站首页 资讯列表 资讯内容

Google 的 AI 大计划:让大模型变小、嵌入每一个产品

2023-06-14| 发布者: 双阳百事通| 查看: 144| 评论: 3|来源:互联网

摘要: 一夜之间,Google在两个层面上突破了人工智能应用的想象力。文丨贺乾明邱豪编辑丨黄俊杰用户1:你在用PaLM2模型...
云服务器 https://www.changxingyun.com

一夜之间,Google在两个层面上突破了人工智能应用的想象力。

文丨贺乾明邱豪

编辑丨黄俊杰

用户1:你在用PaLM2模型了吗?

GoogleBard:我在2023年3月31日切换到了PaLM2。这是GoogleCEO桑达尔·皮查伊(SundarPichai)在《纽约时报》HardFork播客上宣布的。

用户2:你在用PaLM2模型了吗?

GoogleBard:我没有用PaLM2,我用的是一个更小的、正在开发的模型。PaLM2是一个更强大、但还在研究阶段的模型,我不确定它什么时候发布,并对外开放……

今天凌晨举办的GoogleI/O开发者大会之后,将同样的问题抛给Google的聊天机器人Bard,你会看到截然不同的答案。根据Google公布的信息,Bard已经切换到了新一代模型PaLM2,但并没有在3月31日完成切换(但它提到的播客又确实存在)。所以第一个回答对了一部分。

Google没有解决大模型回答不准确的根本问题——可能一时也没人能解决。但新的PaLM2大语言模型,以及同步宣布的一系列激进的产品更新展示了,在当前技术限制下,互联网巨头可以如何推动人工智能实用化。

模型小一点也可以更好用,甚至就在手机上离线运行

Google在会上发布了新一代大语言模型PaLM2,不是一个,而是四个。从小到大,按照参数规模用动物命名:壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn)。

皮查伊说,“壁虎”可以在手机上运行,而且速度足够快、不联网也能正常工作。

此前也有开发者在手机上运行开源的大模型,但速度很慢,一次结果要等上十分钟甚至更久。根本无法与掌控Andriod系统、并具备大模型开发实力的Google相比。

虽然更大的人工智能模型效果往往更好,但消耗的计算能力也更夸张。接入GPT-4的NewBing和ChatGPTPlus,一度让微软的计算资源都捉襟见肘。OpenAI一度暂停用户付费订阅ChatGPTPlus,并限制付费用户每天使用GPT-4的次数。

对于个人用户来说,最可靠的计算能力还是手里的手机、家里的电脑。如果你不玩游戏,这些设备中的算力都是冗余的。更小、消耗计算资源更少的大模型,能把这些冗余的计算资源变得有用。

Google在技术报告中评估了S、M、L三个规模的PaLM2——没跟Google发布会上提到的四个模型对应——在部分任务中,最小的PaLM2会比上一代5400亿参数的PaLM表现好。

英伟达人工智能科学家JimFan将“壁虎”称为PaLM2模型中“最重要的亮点”:“在小屏幕上提高的生产力,要比在大屏幕上多得多。”

根据Google的技术报告,即使是规模最大的“独角兽”版本,PaLM2的参数也比上一代模型少,但在自然语言生成、翻译、推理等多个任务上更强。“这表明扩大模型的规模,并不是增强模型能力的唯一途径。”

这一技术突破对人工智能继续提升发展至关重要。过去几年,Google和OpenAI等公司证实了“模型参数越大,能力更强”的规律,科技公司大模型竞赛把模型参数推高到万亿。训练模型时,它们基本用尽了地球上所有的文本数据。

今年4月,OpenAI首席执行官山姆·阿尔特曼(SamAltman)在麻省理工学院交流时说,“我们正处于巨型模型时代的结尾”,模型的进步不会来自让模型变得更大。

现在Google率先交了答案,但解题过程:“略”。

和OpenAI介绍GPT-4时的方法一样,Google介绍PaLM2时也放出长达90多页的技术报告——沿用学术界常用的arXiv论文格式。格式接近论文,但文章署名作者变成Google公司,研究人员名单被挪到了最后的附录。

类似GPT-4的发布,Google也隐去了PaLM2具体怎样训练模型,模型参数有多大。人工智能研究与学术息息相关,但对于大公司,它最终还是一场激烈的商业竞争。

相比技术细节,Google更愿意讲PaLM2跨语言学习的能力。根据技术文档,Google训练PaLM2时用了100种语言的数据,主要的语言数据中,都有与英文对应的文本。皮查伊说,PaLM2可以理解不同语言之间细微的差异,并生成超出预期的结果。

他举了一个PaLM2帮不同国家的人合作写代码的例子。靠PaLM2,韩国的开发者用韩语注释代码、提出修改建议,美国的开发者一样能看懂。PaLM2还会帮美国的开发者写韩语评论。

皮查伊在发布会中并没有直接提及竞争对手GPT-4。在PaLM2的技术报告中,GPT-4作为参照对象也仅出现了寥寥数次。比如当评估推理能力时,Google称PaLM2在测试推理能力的部分数据集上表现跟GPT-4相当。

一些用户在Reddit论坛和社交媒体上说新Bard“快如闪电”、但写代码还是不如GPT-4。网站设计师MikeHancock说他给GPT-4和Bard出了相同的代码测试题,GPT-4一个答案还没写完,Bard已经给出了三个完整答案,不过最终结果还是GPT-4更好。

Google还展现了用不同数据微调(Fine-tuning)PaLM2后的成果:

Sec-PaLM,用安全数据微调。它可以检测恶意脚本,帮安全专家了解和解决威胁。

Med-PaLM2,用医学数据微调。它能像临床医生一样回答病人问题。准确度接近临床医生。它是第一个医学执照考试中达到“专家”水平的语言模型,也是现在最先进的。Google称,后续还会给它加看X光胶片的能力。

OpenAI已经明确表示短期不会研发下一代模型(GPT-5),而是寻找其他方式让GPT-4变得更好。但Google不打算停下半步。PaLM2刚对大众开放,Google就已经在从头研发新一代的大模型Gemini。

Gemini将是多模态的——能同时处理语言、图片等数据,并集成各种工具和API,“虽然还处于早期阶段,但我们已经看到了之前模型中没有的、印象深刻的功能”。

从搜索到地图再到Gmail,大模型被塞进Google的核心产品

“我们正处于一个激动人心的转折点。”皮查伊说,“通过生成式人工智能,我们正重新构想我们所有的产品。包括搜索。”

Google是用户最多的互联网公司——15个产品用户超过5亿、6个超过20亿。中国以外地区,大部分人用Google的搜索、地图、邮件、视频产品。

在GoogleI/O的主题演讲中,这些产品都有了人工智能驱动的新版本。最受关注的是每年为Google贡献数百亿美元利润的搜索广告。任何一个微小调整,都可能影响根基。

微软的NewBing直接把ChatGPT做成“聊天”界面,鼓励人离开搜索结果——也离开了广告。Google选了一个更平衡的做法,在搜索页嵌入了名为AISnapshot的新模块,展示大模型生成的结果。

当你搜索“适合泳池派对的蓝牙音箱”,页面中先出现传统的搜索结果——十条蓝字链接,几秒后,人工智能生成内容出现并被置顶,告诉你买蓝牙音箱的注意事项(电池寿命、防水性能、音质),并给出购买指南(右侧)、商品链接(下方)和商品的简介,你还可以设定价格(如100美元以下),让它重新生成结果。

不过在手机等移动设备中,AISnapshot会塞满整个屏幕。这会大幅减少传统搜索结果点击频率。再加上Goolge直接给结果而不是链接,各类网站从Google搜索那里获得流量会更难。现在,Google正试验怎么在AISnapshot里加广告。

不是所有搜索都会触发AI生成结果,只有当Google的算法认为人工智能生成的内容优于标准搜索结果时,前者才会出现。用户搜索健康、财务、危害安全等敏感主题时,AISnapshot不会出现。

Google计划先在美国测试AISnapshot,未来几周开放有限的名额。在申请页面,Google还打算测试其他搜索功能,比如在搜索框输入编程问题直接生成代码的CodeTips。

主题演讲中,Google的高管们展现了如何用人工智能改造其他的核心产品:

更沉浸的GoogleMaps。Google用人工智能技术合成了超过10亿张全景地图。当你选定导航路线、确定出发时间后,人工智能会生成一个鸟瞰视角的沉浸式3D路线图,并提前算好天气和交通状况,同步显示在动画中。Google计划今年夏天推出这个功能,之后拓展到伦敦、纽约、东京、旧金山等15个城市。

自动修图的GooglePhotos。你只要提出需求,比如调高亮度、抠掉或补全画面中的物体、移动人物位置、把背景中的乌云改成蓝天等等,新出现的MagicEditor功能就可以自动完成。

自动写邮件的Gmail。你只要在Gmail的“Helpmewrite”工具中输入需求,比如一封要求全额退款的电子邮件,点击创建,它就会结合此前邮件中的信息,写一个完整的邮件。这个功能将会作为Workspace更新中的一部分推出。Workspace的其他功能还包括根据PPT内容自动写演讲文稿等。更强大的聊天机器人Bard。Bard的底层模型换成PaLM2;英文之外加了韩语、日语,预计7月份支持中文;Bard的回复能一键转到Gmail和Docs;帮你手机拍的照片配标题和描述文字;以及支持Adobe没有版权纠纷的图片生成工具Firefly,而不是自己用公开数据集训练的作图应用。下面是让Bard制作一幅用于女儿生日派对的邀请函图片时(要求包含独角兽和生日蛋糕),它的回复:

在人工智能浪潮中,Google一直处于独特的位置。

它是最早研究人工智能、也是技术实力最强的公司之一,拥有许多人工智能底层技术的专利,比如现在大模型的基础架构Transformer。

它也是世界上最大互联网公司,每天服务数十亿人。它拥有的Andriod能直接影响全球30多亿人使用的手机。它比其他公司都更有能力把大模型部署到更多场景。

Google也因此被用户和监管机构密切关注,每个人工智能产品的研发和推出都要考虑法律和社会舆论风险。不少Google员工认为这是OpenAI能抢先推出ChatGPT的原因。

在OpenAI和微软的持续冲击下,Google快速行动,整合了GoogleAI和DeepMind这两个属于公司、但一直不合作的顶级人工智能团队,推迟对外公开最新的研究成果,并积极研发基于人工智能的搜索引擎Magi。这个正在Google内部测试的新产品,也在使用PaLM2。

前不久,皮查伊被问到“没抢在ChatGPT前发布Bard,你错过什么”。他给了个大公司CEO的标准回答,Google不是第一个做出搜索引擎,也不是第一个做出浏览器,“有时候成为第一很重要,但有时候无关紧要。”他认为,只要不断改进产品,实现更好的功能,后发也能先至。

这场开发者大会,展现了Google的人工智能技术积累和产品迭代能力。



分享至:
| 收藏
收藏 分享 邀请

最新评论(0)

Archiver|手机版|小黑屋|双阳百事通  

GMT+8, 2019-1-6 20:25 , Processed in 0.100947 second(s), 11 queries .

Powered by 双阳百事通 X1.0

© 2015-2020 双阳百事通 版权所有

微信扫一扫