周五. 1 月 10th, 2025

站长之家3月31日消息:加州伯克利、斯坦福、卡内基梅隆和加州圣迭戈的研究团队发布了开源的聊天机器人 Vicuna-13B,该机器人基于 Meta 的大语言模型 LLaMA,并使用用户通过 ShareGPT 分享的 7 万对话样本进行了微调。

打开凤凰新闻,查看更多高清图片

开源的聊天机器人 Vicuna-13B 对比测试使用了 OpenAI 的 GPT-4 作为裁判,结果显示 Vicuna-13B 在质量评估方面的表现接近 ChatGPT,达到了九成以上的准确率。而且,Vicuna-13B 的训练成本仅为 300 美元。该聊天机器人的代码采用了 Apache License 2.0 许可证,研究人员计划公开其模型权重。

此前 Meta 发布全新大型语言模型 LLaMA 时介绍称,LLaMA 有 4 种不同大小的模型,分别是 70 亿、 130 亿、 330 亿和 650 亿参数。其中最小的 LLaMA7B 也用了超过 1 万亿个 tokens 来训练。

Meta 说,在很多基准测试中,只有十分之一参数的 LLaMA-13B 比 OpenAI 的 GPT3(175B)还要好。GPT3 是 ChatGPT 所用的 GPT3. 5 的前身。LLaMa-65B 也可以和业界最好的 Chinchilla-70B 和 PaLM-540B 比拼。

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

群通天下
服务平台
跨境人联网
U品出海
选品平台