
背后是各方大模型的角力

百度的“文心一言”,最近又搞出了大新闻。
就在本周二(6月27日),百度在其官网上发布的一篇文章显示,根据《中国科学报》的报道,百度自己的官方大模型“文心一言”(Ernie Bot)3.5版本在若干关键领域,已经超过了现在的“当红炸子鸡”ChatGPT,中文测试中,甚至击败了OpenAI 最新、更先进的模型GPT-4。按照百度首席技术官王海峰博士的说法,与文心大模型3.0版本相比,3.5版本在效果、功能、性能上全面提升,这不仅表现在文心大模型的创作、问答、推理和代码的提升上,还体现在训练速度和推理速度的提升上。对比数据显示,文心大模型3.5的训练速度提升2倍、推理速度提升17倍。这将大大提高模型迭代升级效率,大幅降低训练及使用成本,进一步提升用户体验。“是骡子是马牵出来溜溜”,“文心一言”3.5实力究竟如何,评测数据显然更有说服力。以下是《中国科学报》发布的评测对比结果:“文心一言”3.5(ERNIE 3.5)在多个测试集的得分已超过ChatGPT。“文心一言”3.5和其他大模型评测结果对比
图片来源:中国科学报首先让我们解释一下这张表格:左边一列,是参与评测的各种大模型,其中包括“文心一言”3.5、ChatGPT、以及其升级迭代版本4.0等。而横坐标则是各种测试场景(测试集),至于这些复杂的字母细节,我们其实不需要深究,下面本文简单解释一下就好了。


国内常见的大模型
图片来源:《报告》《报告》还显示,截至目前,中国已发布79个10亿级参数规模以上的大模型,地域和领域分布相对集中。其中,北京有38个大模型,广东有20个大模型。自然语言处理领域是大模型研发最为活跃的重点领域,多模态领域排名第二,计算机视觉和智能语音等领域的大模型还较少。尽管市面上有多个大模型横空出世,但大模型研发门槛高、难度大、投入高,依赖算力、数据等综合支撑的现实不容忽视。在推动大模型产业化的路上,中国企业如何扬长避短,开发出有中国特色的大模型,永远值得业内人士思考。【免责声明】文章内容仅代表作者个人观点,不构成任何投资建议。


