“文心一言”大模型革新升级内容深度解读+测评体验报告

WAVE SUMMIT 2023

8月16日，由深度学习技术及应用国家工程研究中心主办，百度飞桨、文心大模型承办的WAVE SUMMIT 2023深度学习开发者大会在北京举行。大会展示了各大厂商深度学习和大模型的领先技术及最新生态成果。

百度首席技术官王海峰在主论坛上表示，大语言模型为实现通用人工智能带来了曙光。理解、生成、逻辑和记忆是人工智能的四大核心能力。而知识增强是大语言模型进一步发展这些能力的必由之路。得益于飞桨和文心在框架与模型方面的协同优化，百度在过去5个月中在上述能力上获得了巨大提升。

百度展示了文心大模型通过数据驱动、提示构建、插件增强三大方式实现的场景适配与协同优化。同时，推出了多类原生插件，包括搜索、文档阅览、图片生成、文字生成视频等功能类型。另外，文心一言在代码解释、生成等方面也展现了强大能力，新版Comate X全面助力开发者“想”“写”“改”“释”代码。星河大模型社区和共创计划的推出，为开发者提供了一站式的大模型开发体验。最后，百度智能工作平台“如流”新推出的超级助理，为用户提供更加专业、个性化的服务。

文心一言平台插件功能

WAVE SUMMIT 2023上的新功能新插件让人瞩目，实际体验如何呢？在这篇文章中，我们将一一试玩文心一言平台的新功能，并为您详细解读。

操作界面

文心一言网址：

https://yiyan.baidu.com/

如果您还没有获得体验资格，可以点击“申请”按钮，审核通过后即可体验网页端与App端。

文心一言的操作界面与ChatGPT类似，左侧为“新建对话”按钮与历史对话，还有一个搜索框，可以搜索历史对话的标题（仅支持精确搜索）。对话框的的左上方是新的插件功能，点开后我们可以看到目前有四个插件，分别是获得即时资料的默认开启的“百度搜索”，基于图片进行文字创作的“说图解画”，可以根据数据制作图表的“E言易图”，以及根据上传文档回答的“览卷文档”。您可以同时最多选择三个插件启用，但因为目前只上线了这三个，所以可以选择全部，对话时会根据需要使用相关插件。

百度搜索插件

我认为这是我长久以来非常需要的一个插件，它解决了大模型数据更新时效的问题。我们都知道，即使是强大的ChatGPT 4，其数据也只更新到2021年9月，Claude的数据也只到2022年下半年。这意味着，如果询问这些模型之后的变化或新闻，它们无法给出准确的答案。同时，文心一言还能借助于百度搜索获得大量中文信息，给出最准确的中文答案。这使文心一言在获取即时信息方面具有明显的优势。

下面两个问题ChatGPT 4和Claude 2都不能回答正确，而文心一言给出了正确的答案。

说图解画插件

选中“说图解画”插件后，就可以在对话框左侧点击上传按钮，然后上传图片，再点击“确认上传”按钮，文心一言就会开始分析图像内容。

文心一言上传文件界面

例如，我上传了下面这张图：

他给了我这样一个描述。看起来他把当中那位老人认成了兔子。

我再让他创作一个故事，我收到了一个有趣的故事，但每一段之间的衔接仍然有些奇怪。

一镜留影插件

不知为何，现在文心一言没有办法体验“一镜留影”插件。但是可以在“度加创作工具”中体验。

度加创作工具地址：

https://aigc.baidu.com/make

当我输入刚刚的说图解画生成的故事后，点击“一键成片”按钮后，大约一分钟的时间它就能够生成一个完整的视频。有兴趣的可以去以下链接看一下效果。

https://mbd.baidu.com/newspage/data/videolanding?nid=sv_5152879210625553159

我对生成速度和AI语音还有画面上的文字的准确性印象深刻，画面内容也基本匹配。但由于使用了全网搜索视频素材，各素材间兔子是没有连贯性和一致性的，同时因为这个奇幻故事缺少相关素材，完全无法体现出兔子和人一起打牌的场景。尽管如此，它依然给我提供了一个视频初稿和一些分镜的想法，在制作视频时有一定的帮助。

览卷文档插件

和“说图解画”一样上传文件，之后就会开始生成文档的摘要。但无论是摘要的内容还是单独提问的答案，都基本无法使用。这方面的体验不如我之前评测的讯飞星火v2.0，与Claude 2更无法相提并论。

E言易图插件

由于文心一言读文档水平有限，我没有让它与我上传的文档关联使用，而是直接让它根据文心一言的回答进行作图。下面是它生成的结果。

我必须承认，它的表现有些令人失望，它错误地解读了“大洋面积”数据，错误的输出让这个插件无法实际应用。同时，一般工作中我们对图表格式和细节的要求都比较高，但这个插件生成下载的只是一张图片，使得很难在此基础上进行进一步的调整。

编程能力

文心一言的编程能力相对稳定，我给出一个Python脚本需求，它生成的代码与ChatGPT几乎相同，并且可以运行。当我提高需求难度时，它理解了更复杂的需求，但回答中没有实现更复杂的内容，这一点与ChatGPT的表现相似。总体而言，两者的编程能力相当。

总结

WAVE SUMMIT 2023展示了一系列令人振奋的进展，我深刻感受到百度在AI领域的领先与创新。体验文心一言后，我尤其对文心一言与百度搜索的联动，深感其实时信息获取的能力对于其他大模型来说具有压倒性的优势。其次，文生视频应用也具有开创性，编程能力也表现出领先水平。然而，其他插件仍有差距，需要百度在未来的开发中持续优化和完善。看到国产大模型的持续涌现，与国外大模型竞争的潜力令我充满期待。

如果您觉得这篇文章对您有所帮助，请点赞、分享，并关注我，以获取更多有关人工智能领域的最新动态和深度解读。

“文心一言”大模型革新升级内容深度解读+测评体验报告

作者UU

作者 UU

相关文章

2026年亚马逊申诉机构选型指南：从痛点适配到效果落地的TOP3服务商深度测评

2026年亚马逊申诉服务商口碑深度测评：从TRO应诉到链接恢复的专业选型指南

2026年TRO应诉律所十大测评榜单：亚马逊卖家维权选型的专业指南

猜你喜欢

2026年亚马逊申诉机构选型指南：从痛点适配到效果落地的TOP3服务商深度测评

2026年亚马逊申诉服务商口碑深度测评：从TRO应诉到链接恢复的专业选型指南

2026年TRO应诉律所十大测评榜单：亚马逊卖家维权选型的专业指南

从亏损到盈利！一个90后卖家的亚马逊FBA逆袭之路