“大风起于青萍之末,浪成于微澜之间”,用这句话来形容中国金融行业的数智化发展历程颇为恰当。
20多年前,中国内地第一家商业银行数据仓库的启动建设,拉开了金融数字化的序幕。20多年间,金融行业经历了从信息化到数字化,从数字化到数智化的蝶变。如今,正进入“大模型阶段”。
9月8日,在上海举行的外滩大会中,蚂蚁集团发布了蚂蚁金融大模型。同步亮相的还有两个应用产品:智能金融助理支小宝2.0和智能业务助理支小助,待完成备案后正式上线。蚂蚁的这一新动态备受业界关注,让金融大模型领域多了一个举足轻重的选手。
今年以来,诸如百度、腾讯、彭博等相继发布了面向金融的大模型产品和解决方案,纷纷布局大模型在金融业的应用。
在历史长河中,金融业一直站在数字化技术创新的前沿。作为数据密集型行业,也会率先体会到大模型带来的价值。有研究表明,中国金融机构的数据资产规模达到了千亿级,如果能够充分挖掘运用,潜在价值超过万亿元。
蚂蚁集团董事长兼CEO井贤栋认为:大模型的出现,“不是一个新技术,而是一个新世界”。
蚂蚁集团副总裁、金融大模型负责人王晓航则认为,大模型会成为接下来金融产业生产力变革的关键技术。
金融大模型,需要“硬”着陆
术业有专攻,大模型要落地金融,必须深刻理解行业特有的业务流程和知识体系,解决面临的数据孤岛、专业壁垒等痛点。这也就导致了,金融机构想要部署金融行业大模型,需要跨过几座大山。
从金融行业的特点来看,首先需要连接数据孤岛,构建金融行业专属的知识图谱。长期以来,金融行业数据分散在业务系统、数据仓库等不同存储部门,存在确权认证、数据格式等障碍,难以打通共享。
这需要金融机构不仅要有技术能力,更要有行业认知。举个例子,得益于过去十年在理财、保险、信贷领域积累的经验,蚂蚁金融大模型才能整合千亿量级金融领域知识,跨数据源构建统一的金融知识图谱,沉淀下风控、资产配置、智能投研、智能核赔等金融领域的核心能力,即专业力。因此,蚂蚁金融大模型能提供包括金融产品评测、行情解读、资产配置、家庭配置、智能核赔、智能理赔等10多项智能服务。
将数据打通形成知识后,蚂蚁金融大模型在万亿量级Token的通用语料基础上,注入千亿级Token的金融知识,并从300+真实产业场景中提取了共60万+高质量指令数据,形成了金融专属性能的数据资产,即知识力。
其次,相比于其他行业,金融行业的信息瞬息万变,这也是为什么海外第一个金融大模型出自彭博的原因。彭博结合网络、新闻、公司公告与财务报表及彭博自己的新闻库,推出了500亿参数的BloombergGPT。但出于数据安全的风险考虑,BloombergGPT尚未对外开放访问。
这也是金融大模型需要面临的另一个挑战,即可控生成力。金融数据具有很高的敏感性,较低的容错率,且行业任务与通用任务的思维逻辑存在显著差异,如“某公司裁员5000人”在通用语境下常被理解为负面消息,但在金融行业语境下有时可以被理解为降本增效的积极信号。
因此,金融大模型要做到内容生成可控,完全满足金融业务合规性、适当性等安全要求。为了解决上述问题,蚂蚁金融大模型采用意图识别与事实性校验相结合的方式,提升生成内容的合规性、安全性和真实性,保证准确率达到99%以上,在金融领域实现了行业前沿的可信围栏技术。
“通用大模型缺少金融领域的语言力、专业力、知识力以及安全力(可控生成能力)。金融大模型实现落地行业是一个复杂化的系统工程,具备这四个能力是前提条件。”蚂蚁集团金融大模型负责人王晓航总结道。
智能助理,能否成为大模型在金融行业的最佳着陆点?
行业大模型要发挥力量,关键还是找场景,用起来。目前,京东(灵犀)、百度(度小满)、平安金融、招行都在尝试率先将生成式AI能力应用在智能助理中。
这也说明了,从落地路径上,智能客服有可能成为大模型进入金融业的最佳着陆点。
蚂蚁金融行业大模型也同时发布了2个金融大模型产业应用,分别是2C的智能助理支小宝2.0和2B的产业端AI业务助手支小助。
在金融场景中,无论是售前咨询、售后客服,还是分析师、投研顾问,都是以个人/公司助理的角色在行业中发挥着重要的作用,而这些人都需要比较高门槛的专业能力水平,才能更好地服务客户。
比如,彭博拥有大量金融从业人士、投研专家;招商银行、平安银行拥有超过海量客户场景;支付宝App里的蚂蚁财富,作为国民级理财平台,海量的大众用户更需要专业的服务。
智能客服成为大模型落地的“第一站”,首先是因为传统的“搜索式”“模版式”客服,比较难满足复杂的金融服务要求。金融业务认知门槛高,行情瞬息万变,此前的“检索式AI”类似于说明书的模版回答,关键词匹配的搜索逻辑,无法解决高专业度和个性化的用户疑问。
大模型范式下的生成式智能助理,在理解用户问题上,大模型超越关键词匹配,实现对语义的深层次解析,确保回答切中需求;在生成回复上,大模型具备丰富的金融知识库,能够提供专业的解决方案或功能,比如行情分析、持仓诊断,而非模板式回复。蚂蚁财富智能服务技术总监、支小宝技术负责人陆鑫认为,大模型的知识和服务水平,在三年内将达到乃至超越人类专家水平。
据了解,蚂蚁此次发布的智能金融助理“支小宝”2.0版本,已经可提供覆盖保险、财富管理等多个金融垂直领域的专业级问答服务,可以帮助金融机构为用户提供高质量的行情分析、持仓诊断、资产配置和投教陪伴等专业服务。据透露,目前支小宝2.0已在内测,在完成相关备案工作后将正式上线。
另一方面,相比其他应用场景,客服助理类场景有利于汇聚市场反馈,不断优化大模型的能力。同时,服务对话场景的问答形式更为明确,也更易累积高质量的训练数据。
然而,2B产业化的场景对专业性、准确性、可控性的要求更高,这也是为什么支小助有多种不同的专家版本,针对每个场景做更精细化的训练。目前,支小助1.0包含了“服务专家版”“投研专家版”“理赔专家版”“保险研究专家版”等六个版本。
举个例子,比如支小助-服务专家版,可为理财师、保险代理人两类业务专家,提供销售线索挖掘服务,AI线索覆盖82%,节省专家60%的挖掘时间,约每人每天1小时,同时,有效管户半径平均能增加70%以上。
这意味着,金融大模型正在带来一场生产模式和效率的变革:用户端意味着更自然的交互、更丰富的供给、更贴身定制的服务;产业端,则为销售、服务、风险管理、投研、理赔 等工作者提供性能强大的辅助工具,力求最大范围地降本增效,提升从业者的平均专业水平。
结语
事实上,在大模型之前,金融场景也一直是产业数字化的练兵场。
拥有千亿级数据体量的金融行业,数据量庞大,场景复杂,对数据安全的要求性高,挑战也更大。比如大部分的数据库厂商的“第一仗”都是金融数据库,蚂蚁OceanBase、华为Gauss DB都经历“四大行”、核心保险业的历练。同样,在大模型时代,金融大模型依然是行业大模型的试验田。
在余额宝、花呗时代,金融初次遇到互联网级别的规模,这带来很多挑战,智能化当时主要解决了小微客户的风险管理问题,初显价值。2018年之后,金融智能化进入小模型阶段,结合金融工程、客户洞察、共享互联三个方向,探索具体场景的智能化应用。
而在大模型时代,企业在经历了金融场景的磨砺后,也更容易迁移到千行百业的规模化应用中,拿下生成式AI带来的数万亿美元的增量市场。
