周四. 11 月 6th, 2025

上周国内主流大模型应用研究公司陆续发布了它们的大模型APP,本文将对目前热度较高的几款APP进行功能测评,一起来看看各家的表现吧。

测评对象:讯飞星火(科大讯飞)、文心一言(百度)、豆包(字节)

【初始问题】请对大模型APP文心一言、讯飞星火和豆包进行功能对比分析,并进行推荐。

讯飞星火

首轮沟通失败后,让它换个角色尝试,还是失败

文心一言

续上

续上

续上

每款产品都有优缺点,也算是面面俱到的同时又有点不同的侧重了,不过豆包不是字节研发的么,回答准确性待验证

豆包

这个写的确实比较通俗易懂,便于抓住重点,但事实如何且待接下来的问题验证!

对比总结:讯飞的回答虽然没有问题,但对自己的定位略微死板,这样怎么还能和用户友好的玩cosplay呢;文心一言面面俱到(罗里吧嗦),但内容一多,上下文就容易出现自相矛盾,不合逻辑的地方,对用户来说就有点困扰了(要检查一堆内容准确性);豆包回答更为简洁明了,如果准确性也没太大问题就OK了。

顾问型问题】帮助我识别汽车行业中的新兴趋势和发展,并建议如何调整我的技能和知识以保持领先地位。

讯飞星火

主流趋势:电动化、网联化、自动驾驶和新能源基础设施

文心一言

续上

除了讯飞的电动智能网联,还补充了轻量化和循环经济设计

豆包

范围最少,但重点都有,文下列了出处,这一点做的更细致

对比总结:三个模型的回答都还OK,基本都是按点分类进行文本的结构化呈现,其中讯飞的总结话术更符合自然语言的交流习惯,文心一言的列举最为全面,内容充分但有时需再次归纳总结,豆包回答最为聚焦,且有文章出处,便于说明引用,但建议内容有些重复,不够精炼。

【算术类问题】:小明在静水中划船的速度为10千米/时,今往返于某条河,逆水用了9小时,顺水用了6小时,求该河的水流速度。(初中数学)

讯飞星火

看着像模像样,可惜方程解错

文心一言

回答正确!

豆包

方程都没列对,题意还未识别准确

对比总结:文心一言最优,讯飞次之,豆包次次之

逻辑推理型测算每天进入虹桥火车站的电动车有多少?

讯飞星火

文心一言

豆包

对比总结:大家目前都不具备复杂逻辑推理能力,主要还是基于现有的公开信息,进行拼接重组或提炼总结。只是讯飞的建议更像是听懂了我想干嘛。。

以上是对三款大模型APP在顾问式问答、基础计算和逻辑推理三个方面的对比总结。callback豆包对初始问题的回答:“文心一言的回答通常比较全面,能够提供多种可能性和解释。”、“讯飞星火的回答通常比较简洁明了,适合快速获取信息”、“豆包的回答通常比较有趣,能够与用户进行良好的互动”,本轮测试下来感觉文心确实更全面但不一定准,可做启发与参考;讯飞回复比较简洁,且更自然,更有对话感觉;豆包回复最为精炼简单,但没有感觉到有趣。不过本次测试问题有限,结果可能有失偏颇,请大家按需采纳~

接下来会持续对其进行文本加工、文案生成及图形绘画等功能的测评对比,欢迎感兴趣的小伙伴持续关注

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

服务平台
跨境人脉通
选品平台
U选Market
展会&沙龙
群通天下