周三. 6 月 18th, 2025

聊天机器人Bard的推出对于谷歌而言,像是一场灾难:一则谷歌中出现了Bard提供的错误答案,这使公司的股价短暂地下跌了8%。据报道,对Bard进行测试的几位谷歌员工透露,他们对这家搜索引擎的巨头表示严重的担忧,其中一人称其为“病态的骗子”,另一人则认为其“比无用还糟糕”。

Bard,谷歌陷入困境的聊天机器人,正在慢慢改进涉及逻辑和推理的任务。

近日,Google公司发布了其人工智能聊天机器人Bard的两项更新。其中一项更新让Bard更加更加擅长处理数学问题、编码问题和字符串操作。据谷歌方表示,这项更新可以将Bard的数学运算能力提升30%。

另一项更新允许用户将Bard生成的表格直接导出到GoogleSheets中。

通过不断增强的功能,谷歌正在回应质疑,并试图扭转局势。

Bard如何实现数学运算能力提升30%

Bard在数学和编码领域的精进,得益于一种被称为“隐式代码执行”的技术。该技术可以帮助Bard检测和计算“提示”,并在后台运行代码。因此,它可以更准确地响应数学任务、编码问题和字符串操作提示。

例如,Bard可以更好地回答以下“提示”:

15683615的质因数是什么?

计算我的储蓄增长率

帮我把“棒棒糖”这个词倒过来

大模型语言(LLM)本质上是预测引擎。当给出提示词时,他们会通过预测句子中接下来可能出现的单词来做出响应。因此,他们在语言和创造性任务方面的能力非常强,但在推理和数学等领域较弱。为了用高级推理和逻辑能力帮助解决更复杂的问题,仅仅依靠LLM输出是不够的。

为了解决一般LLM中的编码和数学缺陷,Google的新方法是允许Bard生成和执行代码,这种方法的灵感来自于Daniel Kahneman的《思考,快与慢》(Thinking, Fast and Slow)一书中对人类智力二分法的深入研究:“系统1”和“系统2”思维的分离。

系统1的思维快速、直观且毫不费力。爵士音乐家即兴创作时,就正在使用系统1。

系统2的思维缓慢、深思熟虑且费力。乐手学习如何演奏乐器时,就正在使用系统2。

在这个类比中,LLM可以被认为是纯粹在系统1下运行——快速生成文本但没有深入思考。这会带来有益的功能,但也会有缺陷。传统计算与系统2的思维密切相关:它是公式化的,不灵活,但按照正确的步骤顺序可以顺利生成正确的结果。

通过最新更新,谷歌结合了LLM(系统1)和传统代码(系统2)的功能,帮助提高Bard响应的准确性。通过“隐式代码执行”,Bard识别“提示”中有用的逻辑代码,将其写入“幕后”,执行它,并使用其结果来生成更准确的响应。

谷歌表示,基于内部基准测试,与之前的Bard版本相比,新版Bard对“基于计算的”单词和数学问题的响应提高了30%。至于是否经得起外部测试,只能拭目以待。

Bard产品负责人Jack Krawczyk和工程副总裁Amarnag Subramanya共同表示:“即使有了这些改进,Bard也不会总是正确。例如,Bard可能不会生成代码来帮助快速响应,它生成的代码可能是错误的,或者Bard可能不会在其响应中包含已执行的代码。综上所述,这种通过结构化、逻辑驱动的能力进行响应的改进能力是使Bard变得更有帮助的重要一步。”

研元社已开通社群分享,欢迎扫码添加小元微信入群!此群为有效信息共享群,欢迎行业兴趣者、工作者共享信息、互相交流。此群将持续与大家交流共享【人工智能(AI)、元宇宙、AIGC、ChatGPT以及国内外专注于人工智能研发企业的最新动态】

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

服务平台
跨境人脉通
选品平台
U选Market
展会&沙龙
群通天下