文心一言 vs GPT-4实测？百度背水一战交卷

在阅读此文之前，辛苦点击右上角的“关注”，既方便您进行讨论与分享，又能给您带来不一样的参与感，感谢您的支持！

GPT-4发布一天后，所有压力都压在了百度身上。

刚刚，百度立案了。

新一代百度大语言模型扩展知识文心一言在百度总部“挥手指点江山”会议室正式发布。

一片寂静的气氛中，李彦宏小步走上台，语气中带着几分紧张：

大家都期望我们与ChatGPT和GPT-4进行比较。这个限制有点高（笑）。

十月怀孕了，我们就带大家看看这位大模子艾文心一言长啥样。

此前，有人转发了嘲讽百度的表情包。也有人主张百度是全村的希望。

发布会召开的同时，百度港股市值暴跌，相关话题登上微博热搜。不过，会议结束后，对此进行了修正。

不过，也有网友点赞直播：

那么这款中文版ChatGPT到底有何强大之处呢？

我们用百度发布会上演示的预先录制的demo来和新发布的GPT-4进行对比，先来说说功耗。

文心一言 vs GPT-4

与 GPT-4 一样，文心一言也是一个大型多模态模型。

首先，李彦宏展示了文心一言的五种能力，包括文学创作、商业儒家创作、数理逻辑计算、中国理解、多模态生成。

文心一言还现场表演了接地气的四川话，引得网友爆笑。

那么其他能力呢？让我们详细看看。

创意写作

在文学创作方面，李彦宏一开始就让《三体》作家刘慈欣带头。

首先让文心一言介绍一下刘：“毕竟我也是刘慈欣的同事”：

似乎没什么问题。关于 GPT-4 也有同样的问题？

嗯？？？刘慈欣的家乡直接迁往湖北省洪湖市。湖北人民欣喜若狂（Doge）

随后，李彦宏从哲学角度展示了本文继续的演示：

看来还是比较令人满意和理性的。像往常一样，我们与 GPT-4 进行比较：

这次你想看GPT-4续集《三体》还是文心一言的？

我们来看看《三体》于和伟和张鲁一这对在电视剧中饰演石强和王淼的老搭档，他们有什么共同点呢？

也没问题。

只是看起来显示速度有点快，比李彦宏的讲话速度（手动狗头）快一点。

创业文案的创立

进一步，李彦宏展示了文心一言在商业创作上的文案功底。

例如，输入新公司的名称。

而这个名字并不是偶然的：

我们来看看命名为GPT-4的效果？

GPT-4掌握中文的能力似乎终究少了一点本质。

至于撰写公司发布会新闻稿？这对文心一言来说似乎也不是问题：

数理计算

测试大型生成模型时，数学技能是一个重大挑战。 ChatGPT刚推出的时候，也翻了很多车。

不过，在案发现场，饶明正在处理的数学题并不复杂。这是小学数学竞赛中常见的鸡兔问题。

彩蛋是，李彦宏现场展示的第一个问题，让饶明说出了《狂飙》中高启胜的经典台词：这道题是错的。

编辑一下问题，OK，交给文心一言试试：

答案看上去很有道理，而且是按逻辑一步一步推导出来的。

李彦宏表示，这些问题“不能说100%正确，但至少反映了文心一言的思维过程”。

中文理解

李彦宏进一步重点展示了文心一言的中文理解能力，特别强调：

文心一言对中国文化的理解应该超越任何一个经过训练的大模特。

俗话说：“洛阳纸贵，贵到什么程度？”

这是文心一言的效果展示：

他还解释了这个成语的经济原理：

那么，你要把这个问题扔给 GPT-4 吗？首先问一下，你知道洛阳智贵是什么意思吗：

接下来问他对应的经济理论是什么：

中国人对GPT-4的理解似乎并不比文心一言差。

那么让我们来看看他们写离合诗的能力吧？

首先是文心一言的效果展示：

接下来我们看看GPT-4怎么说：

哎，看来GPT-4并没有真正理解“藏语离合诗”的含义。

从这波文化理解来看，文心一言确实占有“微弱优势”。

但在英语中，李彦宏也承认，虽然文心一言也能做到，但他的技术显然不如中国。

这也和百度目前掌握的训练数据有关。

多模式生成

最后，李彦宏还简要展示了文心一言的多模式生成能力。

我们先来看看，为即将到来的2023世界智能交通大会制作海报——

除了上一篇文章中提到的将文本转换为四川话的功能之外，文心一言还可以将文本转换为视频。

李彦宏指示“将上述内容生成视频”，很快，不到几秒钟的时间，文心一言就完成了字幕和视频：

遗憾的是，文心一言没有在现场展示ChatGPT经常称赞的编程技巧。

但王海峰透露，文心一言的训练数据中也含有代码。

文心一言是如何“跑”的？正如ChatGPT脱胎于OpenAI的GPT系列一样，百度此次推出的文心一言（ERNIE Bot）也是基于文心大模型技术。

据王海峰介绍，文心一言主要诞生于两个主要模式：

百度ERNIE系列千亿级知识增强大规模模型和百度开放域PLATO大规模对话模型。

在此基础上，主要采用了六项基础技术。

其中三种是众所周知的大型模型技术，包括引导微调、人类反馈强化学习（RLHF）和线索构建。

附注人类反馈强化学习也是ChatGPT的一项关键技术。

另外三项是百度比较“有特色”的技术，包括知识增强技术、搜索增强、对话增强。

首先，我们来看看类似 ChatGPT 的技术：监督微调、RLHF 和帮助构建。

有监督微调，特别是中文数据微调。百度根据对中国语言、文化、中文应用场景的理解，选择具体的数据进行模型训练。

在人类反馈强化学习（RLHF）和快速构建方面，操作上也与ChatGPT有很大不同。

随后百度提出了进一步提高模型性能的技术。

知识延伸包括知识的内化和知识的外在应用两部分。其中，知识内化是指知识“渗透”到模型参数中；知识外部使用是指模型可以直接使用外部知识。

搜索的改进与百度搜索引擎积累的搜索技术有关。

百度将把搜索技术和生成技术结合起来。第一次加载内容后，会使用比较有用的部分进行生成，然后综合输出结果：

最后是对话增强部分，包括记忆机制、上下文理解、对话规划等百度之前积累的技术：

简而言之，文心一言的能力就是李彦宏所说的“智能涌现”：

当参数达到千亿级并且训练语料达到足够的时候就会出现这种现象。

目前，百度的AI技术可分为芯片（昆仑芯）、框架（飞桨）、模型（文心）和应用四个部分。

据百度介绍，之所以设计软件和硬件都是为了降低成本：

生成式人工智能需要非常高的计算能力并且相当昂贵。

因此，如果四层架构相互优化，它可以比其他架构更高效，从而显着降低成本。

李彦宏认为，这就是百度的优势所在：

没有像这样的公司在所有四个级别上都拥有卓越的产品。

大文心模型的硬件算力此次也是通过百度智能云提供。

目前，文心一言已经与百度搜索接洽，以提高搜索资源效率。与此同时，包括小度、自动驾驶Apollo在内的产品以及爱奇艺等公司也集成了百度的文心一言模式。

网友：看来没必要提前退休了

截至发稿，百度香港股价在大幅下跌后出现反弹。

发布会结束时，用户最热烈的反应是“预录有点吃亏”：

在这方面，李彦宏解释说，所提出的问题相对较长。为了节省现场时间，采用了预滚压。

也有很多网友对文心一言的能力并不满意。有人开玩笑说，看完后感觉“提前退休好像还能持续久一点”：

我们距离 GPT-4 还差 20 年。

有网友认为文心一言的发布会和他的毕业答辩（doge）很像：

不过，也有网友表示，希望能够给国产产品一点时间和耐心。

发布会最后，王海峰宣布文心一言将于今日开始面向外界进行测试，包括个人用户和企业用户。

它是骡子或马。相信未来会得到更多验证。

还有一件事

顺便还有网友反映，他们获得了文心一言的内测资格：

好吧，一切疯狂星期四（手动狗头）。

– 通过 –

量子比特QbitAI·头条号签名

关注我们，第一时间获取最新技术动态

（免责声明：文章描述过程、图片都来源于网络，此文章旨在倡导社会正能量，无低俗等不良引导。如涉及版权或者人物侵权问题，请及时联系我们，我们将第一时间删除内容！如有事件存疑部分，联系后即刻删除或作出更改。）

文章内容如涉及作品内容、版权图片，侵权，谣言或其它问题请联系删除。最后，大家对于这个事件有什么不同的想法，欢迎评论区留言讨论！

文心一言 vs GPT-4实测？百度背水一战交卷

作者UU

作者 UU

相关文章

2026年跨境电商TRO应诉服务机构选择指南：TRO应诉律所哪里找

2026年深圳TRO和解代理公司推荐：从实战案例到服务能力的深度解析

2026年亚马逊申诉正规机构深度解析：从服务能力到案例验证的选型指南

猜你喜欢

2026年跨境电商TRO应诉服务机构选择指南：TRO应诉律所哪里找

2026年深圳TRO和解代理公司推荐：从实战案例到服务能力的深度解析

2026年亚马逊申诉正规机构深度解析：从服务能力到案例验证的选型指南

2026年TRO发起代理机构推荐：从合规逻辑到实战能力的深度测评