周五. 1 月 10th, 2025

在阅读此文之前,辛苦点击右上角的“关注”,既方便您进行讨论与分享,又能给您带来不一样的参与感,感谢您的支持!

GPT-4发布一天后,所有压力都压在了百度身上。

刚刚,百度立案了。

新一代百度大语言模型扩展知识文心一言在百度总部“挥手指点江山”会议室正式发布。

一片寂静的气氛中,李彦宏小步走上台,语气中带着几分紧张:

大家都期望我们与ChatGPT和GPT-4进行比较。这个限制有点高(笑)。

十月怀孕了,我们就带大家看看这位大模子艾文心一言长啥样。

此前,有人转发了嘲讽百度的表情包。也有人主张百度是全村的希望。

发布会召开的同时,百度港股市值暴跌,相关话题登上微博热搜。不过,会议结束后,对此进行了修正。

不过,也有网友点赞直播:

那么这款中文版ChatGPT到底有何强大之处呢?

我们用百度发布会上演示的预先录制的demo来和新发布的GPT-4进行对比,先来说说功耗。

文心一言 vs GPT-4

与 GPT-4 一样,文心一言也是一个大型多模态模型。

首先,李彦宏展示了文心一言的五种能力,包括文学创作、商业儒家创作、数理逻辑计算、中国理解、多模态生成。

文心一言还现场表演了接地气的四川话,引得网友爆笑。

那么其他能力呢?让我们详细看看。

创意写作

在文学创作方面,李彦宏一开始就让《三体》作家刘慈欣带头。

首先让文心一言介绍一下刘:“毕竟我也是刘慈欣的同事”:

似乎没什么问题。关于 GPT-4 也有同样的问题?

嗯? ? ?刘慈欣的家乡直接迁往湖北省洪湖市。湖北人民欣喜若狂(Doge)

随后,李彦宏从哲学角度展示了本文继续的演示:

看来还是比较令人满意和理性的。像往常一样,我们与 GPT-4 进行比较:

这次你想看GPT-4续集《三体》还是文心一言的?

我们来看看《三体》于和伟和张鲁一这对在电视剧中饰演石强和王淼的老搭档,他们有什么共同点呢?

也没问题。

只是看起来显示速度有点快,比李彦宏的讲话速度(手动狗头)快一点。

创业文案的创立

进一步,李彦宏展示了文心一言在商业创作上的文案功底。

例如,输入新公司的名称。

而这个名字并不是偶然的:

我们来看看命名为GPT-4的效果?

GPT-4掌握中文的能力似乎终究少了一点本质。

至于撰写公司发布会新闻稿?这对文心一言来说似乎也不是问题:

数理计算

测试大型生成模型时,数学技能是一个重大挑战。 ChatGPT刚推出的时候,也翻了很多车。

不过,在案发现场,饶明正在处理的数学题并不复杂。这是小学数学竞赛中常见的鸡兔问题。

彩蛋是,李彦宏现场展示的第一个问题,让饶明说出了《狂飙》中高启胜的经典台词:这道题是错的。

编辑一下问题,OK,交给文心一言试试:

答案看上去很有道理,而且是按逻辑一步一步推导出来的。

李彦宏表示,这些问题“不能说100%正确,但至少反映了文心一言的思维过程”。

中文理解

李彦宏进一步重点展示了文心一言的中文理解能力,特别强调:

文心一言对中国文化的理解应该超越任何一个经过训练的大模特。

俗话说:“洛阳纸贵,贵到什么程度?”

这是文心一言的效果展示:

他还解释了这个成语的经济原理:

那么,你要把这个问题扔给 GPT-4 吗?首先问一下,你知道洛阳智贵是什么意思吗:

接下来问他对应的经济理论是什么:

中国人对GPT-4的理解似乎并不比文心一言差。

那么让我们来看看他们写离合诗的能力吧?

首先是文心一言的效果展示:

接下来我们看看GPT-4怎么说:

哎,看来GPT-4并没有真正理解“藏语离合诗”的含义。

从这波文化理解来看,文心一言确实占有“微弱优势”。

但在英语中,李彦宏也承认,虽然文心一言也能做到,但他的技术显然不如中国。

这也和百度目前掌握的训练数据有关。

多模式生成

最后,李彦宏还简要展示了文心一言的多模式生成能力。

我们先来看看,为即将到来的2023世界智能交通大会制作海报——

除了上一篇文章中提到的将文本转换为四川话的功能之外,文心一言还可以将文本转换为视频。

李彦宏指示“将上述内容生成视频”,很快,不到几秒钟的时间,文心一言就完成了字幕和视频:

遗憾的是,文心一言没有在现场展示ChatGPT经常称赞的编程技巧。

但王海峰透露,文心一言的训练数据中也含有代码。

文心一言是如何“跑”的?正如ChatGPT脱胎于OpenAI的GPT系列一样,百度此次推出的文心一言(ERNIE Bot)也是基于文心大模型技术。

据王海峰介绍,文心一言主要诞生于两个主要模式:

百度ERNIE系列千亿级知识增强大规模模型和百度开放域PLATO大规模对话模型。

在此基础上,主要采用了六项基础技术。

其中三种是众所周知的大型模型技术,包括引导微调、人类反馈强化学习(RLHF)和线索构建。

附注人类反馈强化学习也是ChatGPT的一项关键技术。

另外三项是百度比较“有特色”的技术,包括知识增强技术、搜索增强、对话增强。

首先,我们来看看类似 ChatGPT 的技术:监督微调、RLHF 和帮助构建。

有监督微调,特别是中文数据微调。百度根据对中国语言、文化、中文应用场景的理解,选择具体的数据进行模型训练。

在人类反馈强化学习(RLHF)和快速构建方面,操作上也与ChatGPT有很大不同。

随后百度提出了进一步提高模型性能的技术。

知识延伸包括知识的内化和知识的外在应用两部分。其中,知识内化是指知识“渗透”到模型参数中;知识外部使用是指模型可以直接使用外部知识。

搜索的改进与百度搜索引擎积累的搜索技术有关。

百度将把搜索技术和生成技术结合起来。第一次加载内容后,会使用比较有用的部分进行生成,然后综合输出结果:

最后是对话增强部分,包括记忆机制、上下文理解、对话规划等百度之前积累的技术:

简而言之,文心一言的能力就是李彦宏所说的“智能涌现”:

当参数达到千亿级并且训练语料达到足够的时候就会出现这种现象。

目前,百度的AI技术可分为芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用四个部分。

据百度介绍,之所以设计软件和硬件都是为了降低成本:

生成式人工智能需要非常高的计算能力并且相当昂贵。

因此,如果四层架构相互优化,它可以比其他架构更高效,从而显着降低成本。

李彦宏认为,这就是百度的优势所在:

没有像这样的公司在所有四个级别上都拥有卓越的产品。

大文心模型的硬件算力此次也是通过百度智能云提供。

目前,文心一言已经与百度搜索接洽,以提高搜索资源效率。与此同时,包括小度、自动驾驶Apollo在内的产品以及爱奇艺等公司也集成了百度的文心一言模式。

网友:看来没必要提前退休了

截至发稿,百度香港股价在大幅下跌后出现反弹。

发布会结束时,用户最热烈的反应是“预录有点吃亏”:

在这方面,李彦宏解释说,所提出的问题相对较长。为了节省现场时间,采用了预滚压。

也有很多网友对文心一言的能力并不满意。有人开玩笑说,看完后感觉“提前退休好像还能持续久一点”:

我们距离 GPT-4 还差 20 年。

有网友认为文心一言的发布会和他的毕业答辩(doge)很像:

不过,也有网友表示,希望能够给国产产品一点时间和耐心。

发布会最后,王海峰宣布文心一言将于今日开始面向外界进行测试,包括个人用户和企业用户。

它是骡子或马。相信未来会得到更多验证。

还有一件事

顺便还有网友反映,他们获得了文心一言的内测资格:

好吧,一切疯狂星期四(手动狗头)。

– 通过 –

量子比特QbitAI·头条号签名

关注我们,第一时间获取最新技术动态

(免责声明:文章描述过程、图片都来源于网络,此文章旨在倡导社会正能量,无低俗等不良引导。如涉及版权或者人物侵权问题,请及时联系我们,我们将第一时间删除内容!如有事件存疑部分,联系后即刻删除或作出更改。)

文章内容如涉及作品内容、版权图片,侵权,谣言或其它问题请联系删除。最后,大家对于这个事件有什么不同的想法,欢迎评论区留言讨论!

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

群通天下
服务平台
跨境人联网
U品出海
选品平台