周三. 5 月 14th, 2025

■本报记者 赵广立

近期,ChatGPT频上热搜,大家纷纷通过各种渠道体验,中国计算机学会常务理事、之江实验室副主任鲍虎军就是其中之一。

跟ChatGPT“聊”下来,鲍虎军感受到其强大,甚至觉得它有些“圆滑”,因为它不仅能拒绝回答不恰当的提问,还“懂得承认错误”,调整后续答案。

“这说明它背后的信息学习和整合机制是非常完善的。”鲍虎军说。

解决“对齐”问题ChatGPT更“丝滑”

对话机器人早已不是新鲜事物,ChatGPT何以一骑绝尘?这恐怕要从其“丝滑”的对话体验及超常表现说起。

这类机器人的本质是人工智能机器学习模型。在研发初期,开发者通常会输入大量贴有“标签”的数据,对模型系统进行训练,让系统通过算法自动输出结果。

如果只靠自动输出结果,ChatGPT也许和其他聊天机器人无异。它的横空出世离不开两样东西——大型语言模型(LLM)和一种名为人类反馈强化学习(RLHF)的机制。

众所周知,ChatGPT脱胎于OpenAI的GPT3(升级后为GPT3.5),但OpenAI开发团队对它的训练更动人心魄。在系统训练过程中,团队先用少量的问答标注数据,微调预训练大模型GPT3.5,然后训练者接入系统不断提出大量问题,由GPT3.5模型对每个问题给出若干答案,人工对答案满意度进行打分排序,并建立奖惩模型,最后不断循环、强化学习,才得到了最终的问答模型。

这种训练机制又被称为RLHF。鲍虎军表示,这种训练机制解决了大模型回答问题与人类认知和需求“对齐”的问题,在工程上实现了重要创新。这就是ChatGPT的答案常常能够令人舒适的关键因素之一。

“这让系统给出的答案和人类的常识、认知、需求、价值观更加贴合。”鲍虎军说。

过去,人们在大模型的使用中往往面向专业领域进行开发,这推动着基础大模型逐渐变为面向专业的行业大模型。但是,在不同专业领域应用中,开发者需要用基础模型对该领域标记的关键数据进行微调训练,而此后模型的使用并不开放,这导致模型的应用效能并不高。

ChatGPT与此不同。它的参数在部署之后,模型不再变更,通过广泛的用户使用,不断汇聚相关信息、不断进行新的内容学习和整合,让ChatGPT不断优化。按照ChatGPT 目前的月活跃用户1亿计,它的变化与日俱增。

“1亿用户不断为它提供数据,让它变得强大。”鲍虎军认为,ChatGPT从能力和模式上,解决了多年来人机对话交流难以逾越的重大挑战,正是这种大规模模型预训练和拟人问答“对齐”技术的变革引发了各界的共鸣。

要复刻ChatGPT,先闯三关

ChatGPT的爆火,搅动了人们对AI产业期望的一池春水。在不断加码OpenAI后,微软发布全新“必应”(Bing)搜索工具,让人们可以在Edge浏览器上体验ChatGPT。感受到危机的谷歌动作频频,并在2月7日发布了下一代对话AI系统Bard,只是首战“出师不利”。

国内也是一派奋起直追的景象。2月7日,百度宣布推出生成式对话产品“文心一言”(英文名 ERNIE Bot),并约定“3月和大家正式见面”;2月10日,美团联合创始人王慧文高调宣布自带5000万美元入局AI,目前已成再创业之势,希望“打造中国OpenAI”;360集团也称有200多亿元的资金支持进行类ChatGPT技术的研究,创始人周鸿祎更直言“不会放弃对ChatGPT相关技术的研究和跟踪”……

ChatGPT引发的这波热潮,让人直呼“有点梦回2016的意思”。那一年的AI头条是李世石大战AlphaGo。

鲍虎军认为,ChatGPT等AI工具的进一步广泛应用,有望极大提升内容创作和人机交互的能力,它们也会成为像互联网平台一样的基础设施,给人类带来生产能力的提升。图像、文本、声音等多模态类型计算互通转换的引入,将带来更大的想象空间。

不过,要在中国复刻OpenAI、打造国产化的ChatGPT绝非易事。鲍虎军认为,机器学习模型开发者很多,要做好ChatGPT类项目,工程实现是“重头戏”。

“一个好的机器学习模型,并不是开发完成就结束了,而是要找到一种真正便捷的使用模式,让人工智能为更多人解决实际问题。”鲍虎军说。

他表示,当业界奋起直追ChatGPT时,也要看到,ChatGPT的诞生不是一蹴而就的。ChatGPT的成功离不开强大的技术创新、工程实现能力以及投资人的勇气。

而闯这“三关”之前,还要看自身技术和资源的积累。公开数据显示,OpenAI于2018年6月发布GPT1,迄今迭代至GPT3.5,已经历了多年的技术积累。ChatGPT模型的前身语言模型GPT3,其参数规模达到了1750亿,使用超45TB数据进行训练;后期研发不仅引入了微软的资本加持,还投入了大量时间与精力……

“做出一个好成果,需要构想、研发、商业等多方力量投入,哪个层面都不能浮躁,需要耐心与坚持。” 鲍虎军说。

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

服务平台
跨境人脉通
选品平台
U选Market
展会&沙龙
群通天下