谷歌Bard的数学能力提升了30%！

聊天机器人Bard的推出对于谷歌而言，像是一场灾难：一则谷歌中出现了Bard提供的错误答案，这使公司的股价短暂地下跌了8%。据报道，对Bard进行测试的几位谷歌员工透露，他们对这家搜索引擎的巨头表示严重的担忧，其中一人称其为“病态的骗子”，另一人则认为其“比无用还糟糕”。

Bard，谷歌陷入困境的聊天机器人，正在慢慢改进涉及逻辑和推理的任务。

近日，Google公司发布了其人工智能聊天机器人Bard的两项更新。其中一项更新让Bard更加更加擅长处理数学问题、编码问题和字符串操作。据谷歌方表示，这项更新可以将Bard的数学运算能力提升30%。

另一项更新允许用户将Bard生成的表格直接导出到GoogleSheets中。

通过不断增强的功能，谷歌正在回应质疑，并试图扭转局势。

Bard如何实现数学运算能力提升30%

Bard在数学和编码领域的精进，得益于一种被称为“隐式代码执行”的技术。该技术可以帮助Bard检测和计算“提示”，并在后台运行代码。因此，它可以更准确地响应数学任务、编码问题和字符串操作提示。

例如，Bard可以更好地回答以下“提示”：

15683615的质因数是什么？

计算我的储蓄增长率

帮我把“棒棒糖”这个词倒过来

大模型语言（LLM）本质上是预测引擎。当给出提示词时，他们会通过预测句子中接下来可能出现的单词来做出响应。因此，他们在语言和创造性任务方面的能力非常强，但在推理和数学等领域较弱。为了用高级推理和逻辑能力帮助解决更复杂的问题，仅仅依靠LLM输出是不够的。

为了解决一般LLM中的编码和数学缺陷，Google的新方法是允许Bard生成和执行代码，这种方法的灵感来自于Daniel Kahneman的《思考，快与慢》（Thinking, Fast and Slow）一书中对人类智力二分法的深入研究：“系统1”和“系统2”思维的分离。

系统1的思维快速、直观且毫不费力。爵士音乐家即兴创作时，就正在使用系统1。

系统2的思维缓慢、深思熟虑且费力。乐手学习如何演奏乐器时，就正在使用系统2。

在这个类比中，LLM可以被认为是纯粹在系统1下运行——快速生成文本但没有深入思考。这会带来有益的功能，但也会有缺陷。传统计算与系统2的思维密切相关：它是公式化的，不灵活，但按照正确的步骤顺序可以顺利生成正确的结果。

通过最新更新，谷歌结合了LLM（系统1）和传统代码（系统2）的功能，帮助提高Bard响应的准确性。通过“隐式代码执行”，Bard识别“提示”中有用的逻辑代码，将其写入“幕后”，执行它，并使用其结果来生成更准确的响应。

谷歌表示，基于内部基准测试，与之前的Bard版本相比，新版Bard对“基于计算的”单词和数学问题的响应提高了30%。至于是否经得起外部测试，只能拭目以待。

Bard产品负责人Jack Krawczyk和工程副总裁Amarnag Subramanya共同表示：“即使有了这些改进，Bard也不会总是正确。例如，Bard可能不会生成代码来帮助快速响应，它生成的代码可能是错误的，或者Bard可能不会在其响应中包含已执行的代码。综上所述，这种通过结构化、逻辑驱动的能力进行响应的改进能力是使Bard变得更有帮助的重要一步。”

研元社已开通社群分享，欢迎扫码添加小元微信入群！此群为有效信息共享群，欢迎行业兴趣者、工作者共享信息、互相交流。此群将持续与大家交流共享【人工智能（AI）、元宇宙、AIGC、ChatGPT以及国内外专注于人工智能研发企业的最新动态】

谷歌Bard的数学能力提升了30%！

作者UU

作者 UU

相关文章

智能眼镜不是一张榜单：Meta之外，中国玩家的四条路线

这届世界杯花钱最狠的人，不懂球 2026世界杯消费报告

2026亚马逊侵权预判机构大盘点：深圳合规知识产权服务商优点解析，挑选正规机构避坑指南全收录

猜你喜欢

智能眼镜不是一张榜单：Meta之外，中国玩家的四条路线

这届世界杯花钱最狠的人，不懂球 2026世界杯消费报告

2026亚马逊侵权预判机构大盘点：深圳合规知识产权服务商优点解析，挑选正规机构避坑指南全收录

2026适配亚马逊卖家的跨境电商上架防侵权服务商大盘点深圳合规标杆机构实力解析+签约避坑全指南