WAVE SUMMIT 2023
8月16日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型承办的WAVE SUMMIT 2023深度学习开发者大会在北京举行。大会展示了各大厂商深度学习和大模型的领先技术及最新生态成果。

百度首席技术官王海峰在主论坛上表示,大语言模型为实现通用人工智能带来了曙光。理解、生成、逻辑和记忆是人工智能的四大核心能力。而知识增强是大语言模型进一步发展这些能力的必由之路。得益于飞桨和文心在框架与模型方面的协同优化,百度在过去5个月中在上述能力上获得了巨大提升。

百度展示了文心大模型通过数据驱动、提示构建、插件增强三大方式实现的场景适配与协同优化。同时,推出了多类原生插件,包括搜索、文档阅览、图片生成、文字生成视频等功能类型。另外,文心一言在代码解释、生成等方面也展现了强大能力,新版Comate X全面助力开发者“想”“写”“改”“释”代码。星河大模型社区和共创计划的推出,为开发者提供了一站式的大模型开发体验。最后,百度智能工作平台“如流”新推出的超级助理,为用户提供更加专业、个性化的服务。

文心一言平台插件功能
WAVE SUMMIT 2023上的新功能新插件让人瞩目,实际体验如何呢?在这篇文章中,我们将一一试玩文心一言平台的新功能,并为您详细解读。
操作界面
文心一言网址:
https://yiyan.baidu.com/
如果您还没有获得体验资格,可以点击“申请”按钮,审核通过后即可体验网页端与App端。
文心一言的操作界面与ChatGPT类似,左侧为“新建对话”按钮与历史对话,还有一个搜索框,可以搜索历史对话的标题(仅支持精确搜索)。对话框的的左上方是新的插件功能,点开后我们可以看到目前有四个插件,分别是获得即时资料的默认开启的“百度搜索”,基于图片进行文字创作的“说图解画”,可以根据数据制作图表的“E言易图”,以及根据上传文档回答的“览卷文档”。您可以同时最多选择三个插件启用,但因为目前只上线了这三个,所以可以选择全部,对话时会根据需要使用相关插件。

百度搜索插件
我认为这是我长久以来非常需要的一个插件,它解决了大模型数据更新时效的问题。我们都知道,即使是强大的ChatGPT 4,其数据也只更新到2021年9月,Claude的数据也只到2022年下半年。这意味着,如果询问这些模型之后的变化或新闻,它们无法给出准确的答案。同时,文心一言还能借助于百度搜索获得大量中文信息,给出最准确的中文答案。这使文心一言在获取即时信息方面具有明显的优势。
下面两个问题ChatGPT 4和Claude 2都不能回答正确,而文心一言给出了正确的答案。


说图解画插件
选中“说图解画”插件后,就可以在对话框左侧点击上传按钮,然后上传图片,再点击“确认上传”按钮,文心一言就会开始分析图像内容。
文心一言上传文件界面
例如,我上传了下面这张图:

他给了我这样一个描述。看起来他把当中那位老人认成了兔子。

我再让他创作一个故事,我收到了一个有趣的故事,但每一段之间的衔接仍然有些奇怪。

一镜留影插件
不知为何,现在文心一言没有办法体验“一镜留影”插件。但是可以在“度加创作工具”中体验。
度加创作工具地址:
https://aigc.baidu.com/make
当我输入刚刚的说图解画生成的故事后,点击“一键成片”按钮后,大约一分钟的时间它就能够生成一个完整的视频。有兴趣的可以去以下链接看一下效果。
https://mbd.baidu.com/newspage/data/videolanding?nid=sv_5152879210625553159
我对生成速度和AI语音还有画面上的文字的准确性印象深刻,画面内容也基本匹配。但由于使用了全网搜索视频素材,各素材间兔子是没有连贯性和一致性的,同时因为这个奇幻故事缺少相关素材,完全无法体现出兔子和人一起打牌的场景。尽管如此,它依然给我提供了一个视频初稿和一些分镜的想法,在制作视频时有一定的帮助。
览卷文档插件
和“说图解画”一样上传文件,之后就会开始生成文档的摘要。但无论是摘要的内容还是单独提问的答案,都基本无法使用。这方面的体验不如我之前评测的讯飞星火v2.0,与Claude 2更无法相提并论。
E言易图插件
由于文心一言读文档水平有限,我没有让它与我上传的文档关联使用,而是直接让它根据文心一言的回答进行作图。下面是它生成的结果。


我必须承认,它的表现有些令人失望,它错误地解读了“大洋面积”数据,错误的输出让这个插件无法实际应用。同时,一般工作中我们对图表格式和细节的要求都比较高,但这个插件生成下载的只是一张图片,使得很难在此基础上进行进一步的调整。
编程能力
文心一言的编程能力相对稳定,我给出一个Python脚本需求,它生成的代码与ChatGPT几乎相同,并且可以运行。当我提高需求难度时,它理解了更复杂的需求,但回答中没有实现更复杂的内容,这一点与ChatGPT的表现相似。总体而言,两者的编程能力相当。
总结
WAVE SUMMIT 2023展示了一系列令人振奋的进展,我深刻感受到百度在AI领域的领先与创新。体验文心一言后,我尤其对文心一言与百度搜索的联动,深感其实时信息获取的能力对于其他大模型来说具有压倒性的优势。其次,文生视频应用也具有开创性,编程能力也表现出领先水平。然而,其他插件仍有差距,需要百度在未来的开发中持续优化和完善。看到国产大模型的持续涌现,与国外大模型竞争的潜力令我充满期待。
如果您觉得这篇文章对您有所帮助,请点赞、分享,并关注我,以获取更多有关人工智能领域的最新动态和深度解读。
