


PALM 2秀肌肉,手机也能跑
OpenAI的GPT-4,已经被全世界公认为最强大的语言模型。怎么对打GPT-4?谷歌的答案,就是PaLM 2。恰在今天,谷歌一同发布了PaLM 2技术报告。






这些微调就像给一个卡车底盘,加上一个新的发动机或前保险杠,以在某些特定任务上更好地工作。
这样的优势不言而喻,不用花费大量的时间和资源来创建,直接部署。
另外,PaLM2有一个基于健康数据训练的版本Med-PaLM 2,可以轻松通过美国医学执照考试,达到「专家」水平。


下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本,而且还为用户体验开辟了全新的途径。例如,一个元应用程序可以从你的移动工作流程中学习,并为你实现自动化。在小屏幕上节省的生产力,将比在大屏幕上多得多。



Duet AI:办公全家桶新升级
此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。怎么破?谷歌这次祭出了Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。




Bard又双叒叕便强了
发布会上,谷歌还宣布了一个重磅消息。那就是,Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。这次,Bard上新了不少功能,比如支持了两种新的语言——日语和韩语,用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail,可视化搜索,以及深色模式等等。不过,最令用户开心的,想必是谷歌决定取消Bard的等候名单——将在180个国家或地区提供服务。此外,和Adobe的AI图像生成功能,以及Instacart和OpenTable等第三方服务的功能整合也正在路上。总的来看,这些上新是给老Bard注入的一针强心剂。目前,谷歌正在使Bard变得更加可视化,让Bard能够分析图像,并且能在查询结果中提供图像信息等等。关于这一方面,谷歌在发布会上展示了一个案例。假如用户问Bard,美国的新奥尔良有哪些必看的景点,那么Bard就能图文并茂的解答这个问题。就像用户在谷歌搜图中问同样的问题一样。你还可以,用Bard起草邮件,并一键导入Gmail,还有文档中。而另一个更好玩儿的功能是用图像提示系统。该功能由Google Lens提供,它能够识别图片中的物体。比方说,上传一张狗狗的照片,然后给一个prompt「为这两只狗写编一个有趣的标题」。Google Lens就可以识别狗狗的品种,然后Bard就能写下与这两只狗狗特征相关的内容。该功能目前可能还不太完善,虽说潜力无限。未来如何取决于系统的整合程度。虽说对Bard来讲,这是一个相当重大的更新,但和OpenAI的ChatGPT,以及微软的Bing之间的差距仍然是肉眼可见的。要知道,微软在3月就给Bing增加了由OpenAI的DALL-E系统支持的AI图像生成功能。而OpenAI和微软一直在探索如何将聊天机器人与更多种的网络服务相结合。不仅如此,OpenAI早些时候还宣布了ChatGPT将和OpenTable预订餐厅,以及Instacart订货配送的功能相结合。谷歌表示,这些功能自己之后也会有的。代码能力up谷歌表示,升级后的Bard将会非常擅长处理有关代码的问题,包括调试和解释20多种语言的代码。因此,今天发布会上的一些升级主要集中在这个方面上。包括新的深色模式,改进的代码引用功能——不仅能提供来源,还能解释代码片段,以及一个新的导出功能。用户可以把代码发送到谷歌的Colab平台,还能和另一个基于浏览器的IDE——Replit一起使用(从Python查询开始)。只要选中代码,就可以一键导出到Colab或者Replit。还支持20+种编程语言。基本涵盖了码农们所需的所有编程需要。甚至还能直接询问Bard怎么用某一种语言实现某种功能。只要prompt到位,生成一串代码也就是几秒钟的事。写完以后,还能就着某一行代码进行解释,以及完善。如此看来,结合了PaLM2的Bard应该会在生成质量上有明显的提升。当然,具体表现如何,还得再观察。对战必应,谷歌AI搜索已来
此前,整合进GPT的必应势如破竹,真正威胁到了谷歌的搜索市场。为了与微软必应竞争,谷歌同在今天推出了由PaLM 2驱动的全新搜索引擎。它能够提供问题回答的摘要,比如问「为什么酵母面包仍然如此受欢迎?」,谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等等。另外,在生成内容旁,给出了3个链接,以证明摘要中的内容。这样以减少AI在生成内容上出现「幻觉」问题。当你搜索蓝牙音箱,首先顶部有一个简短的摘要,详细说明了购买时应注意的事项:电池寿命、防水性、音质。右边是三个购买指南的链接,下面是6个不错选择的购物链接,每个旁边都有一个 AI 生成的摘要。可以看到,这是谷歌搜索结果页面的new look。把AI生成内容放在最开始。比起重新设计的微软必应,搜索结果顶部的AI框对谷歌来说更像是,一个小小的更新。值得注意的是,要是想要访问这一功能,你必须选择Search Generative Experience(SGE)这一新功能。并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时,AI内容才会出现,而像健康、财务等敏感主题完全不会有AI生成。谷歌表示,其改进后的搜索引擎能够以对话方式跟踪原始搜索查询的选项,无需重复已经提供的上下文或细节。然而,谷歌搜索也不是无所不能,也存在从未完全解决过的问题——结构编排(orchestration of structure)。因为大部分数据储存在互联网上,甚至谷歌内部,但将所有这些数据放在一起形成一个连贯的答案真的很难。目前,已经开放候补名单仅限美国,谷歌表示,未来几个月将考虑更广泛地推出这一功能。一键退款,智能P图,沉浸导航
一键生成退款邮件?谷歌行。劈柴在发布会一开始就整了个小活。航班取消了得退款?不会写申请退款的邮件?gmail会。只要在prompt栏里输入要求,gmail分分钟生成了一篇有理有据有节的退款申请邮件。另外,谷歌Map现在也有了沉浸式view,你想去哪,怼脸的实景导航来了。你还能顺便问问空气质量、天气、交通状况,都能即时演示。Magic Editor是谷歌最新公布的照片处理功能,使用生成性AI,可以让用户在没有专业工具的情况下对照片进行各种编辑。不会p图星人的福音来了?发布会上,谷歌分享了几个应用了这项新功能的案例,不得不说,效果酷炸了。比如下面这张,Magic Editor一键把瀑布前的人像挪到了侧面,还把背景中别的游客p掉了。不仅如此,本来多云的天气硬是给p蓝了。再比如下面这张,Magic Editor一键将长凳上的小孩连着凳子一起移到了中间,自动补齐了多出来的椅子,还把原画中缺失的气球补齐了。而且天也p蓝了。当然,这项功能还没到最完美的地步。就比方说,仔细看看上面这张图片,凳子挪动了,可是底下的影子没动。但总归,这项功能对照片本身的理解是革命性的。当然,咱现在还不用太担心是不是有的图片被Magic Editor处理过。因为谷歌说了,下半年才会推出这项功能。AI笔记本Project Tailwind
学生党福音来了。不得不说,谷歌还真把学生们拿捏住了。Project Tailwind从本质上讲,就是个笔记本,但是加了AI的能力。一下子就不一样了。用户可以像问导师或者学习搭子一样进行在Tailwind里进行检索。虽说谷歌把这个功能其定位为学生服务的工具,但是对于日常需要处理大量文本的打工人来说,也是重大利好。谷歌产品管理高级总监表示,Tailwind就像一个真正的笔记本一样,你在里面记东西,而这些内容就是AI学习的对象。用户可以简便地从谷歌云端硬盘中挑选文件,有效创建了一个兼具个性化和私人属性的AI模型。目前,该功能在大学校园内进行了广泛的测试。在示例演示中,Tailwind收集了一大堆学习笔记,然后,生成了包括主题词在内的很多内容,比如,用户可以为特定主题创建术语表。Tailwind不仅仅能为学生服务,它对任何从不同来源获取信息的人都有帮助。隐藏在Tailwind背后的理念是,为什么我们不能为每个用户定制不同的AI语言模型呢?当然,这里存在两个问题。一方面是成本问题。训练语言模型所需的计算需求和微调成本都很高,谁来负担这个成本?另一方面则是信息安全性。毕竟,捏造信息这种事可一点都不稀奇,谁能保证个性化的笔记本不会出现同样的问题呢。不过,是骡子是马还得拉出来遛遛。用户目前可以注册Project Tailwind进行测试。该功能也是AI Labs计划的一部分。安卓开发小助手
此外,谷歌I/O大会上还推出了专为Android开发的AI编码机器人Studio Bot。不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持Kotlin和Java编程语言,并将直接嵌入到Android Studio开发工具的工具栏中。参考资料:https://io.google/2023/intl/zh/
酷玩实验室经授权转载
如需转载,请联系原作者
分享给朋友或朋友圈请随意静待时间给出答案!