龙年预见·新质生产力|大模型落地金融业,尚有这些关键点

银柿财经 李慧子 2024-02-15 09:57:05

金融机构对大模型的应用仍处于探索、研发或试用阶段,模型幻觉、安全合规采集等问题的存在决定了其在采用金融大模型方面更为谨慎。

编者按:过去的一年,人类社会在AI、具身机器人、脑机接口等领域取得瞩目成就,令我们目不暇接。新时代的大门已经开启。站在龙年开首,我们想问,科技进步带来的新质生产力会把我们带向何方?光芯片、飞行汽车以及不断进化的AI,又会打开一幅怎样的人类社会图景?在此,请同银柿财经一起,聆听技术最前沿科学家们的声音。


自2022年11月ChatGPT问世以来,生成式AI大模型的浪潮便迅速席卷全球,成为人工智能领域最炙手可热的赛道。在赛事行至中场之时,从业者对于行业发展图谱的认知也愈发清晰:大模型只有从通用走向垂直,并迅速投入到产业应用才是王道。

其中,金融行业因其数据密集型和科技驱动型的行业属性,被视为垂直大模型应用落地的最优场景之一。也正因如此,有越来越多企业开始布局金融垂类,截至目前,度小满、蚂蚁集团(06688.HK)、华为、腾讯云、马上消费金融、同花顺(300033.SZ)等公司都开发了金融大模型,并积极探索这一垂直行业的应用场景。

金融大模型目前进展如何?还有哪些应用前景有待开发?落地过程中数据安全和隐私合规如何得到保障?2024年金融大模型又将涌现出哪些技术突破点?站在龙年的起点,银柿财经采访到了同花顺金融大模型HithinkGPT的研发团队,试图探寻这些问题的答案。

据悉,和国内外其他大模型相比,HithinkGPT在金融数据方面具备数据覆盖广、量极大、质量优、合规强等优势,并展现了强大的分析、预测、推理能力。这些优势的获得主要得益于研发团队从训练语料、训练框架到模型结构的设计。

“HithinkGPT预训练阶段金融语料约1.4T token,占比超过了50%。”HithinkGPT研发人士介绍称,在使用优质金融语料训练后,HithinkGPT的金融知识储备远超其他金融大模型。

在模型应用方面,同花顺凭借多年来的数据积累和业务经验,将金融RAG体系,金融领域专家系统,知识图谱,领域知识库等集成在HithinkGPT中,使其具备了实时分析、逻辑推理、精准预测的能力。

即便HithinkGPT拥有诸多优势,但研发人士坦言,“模型幻觉问题目前依然存在,实际部署的推理成本较高,推理速度不够理想,离真正的商业化落地应用还有一些距离。”

研发人士所说的“模型幻觉”(Model hallucination),指的是大模型在缺乏足够信息或面对模棱两可的输入时,生成的错误、虚构或无根据的错误回答。

在研发人士看来,这种错误回答在金融行业是不可容忍的。金融行业容错率较低,无论是知识问答,还是内容提取上,都对大模型技术提出非常高的要求。“只有真正解决了模型幻觉,才能实现to c应用。”

不过在面对模型幻觉时也并非无计可施,研发人士表示,通过数据清洗,RAG技术,RLHF对齐等方法可以有效降低模型幻觉。未来可能会通过研究和开发新的模型解释性工具,开发新的模型架构和训练技术(如更细粒度的注意力机制、更有效的上下文理解能力)等方式来修正并减少模型幻觉问题。

从应用进展来看,目前金融大模型已涉及运营、客服、营销、风控、研究以及贷后等多个场景,但不少分析认为,金融机构对大模型的应用仍处于探索、研发或试用阶段。

研发人士称,除了对“模型幻觉”的考量外,金融行业本身对数据安全合规有着严格的要求,也决定了其在采用金融大模型方面更为谨慎。

对此,同花顺在向金融机构提供大模型服务时,将采用问句侧风控,模型本身安全性能增强,答案侧风控三层风控机制来保障合规性。“HithinkGPT对于违规问题的风控召回率已经达到99%+。”研发人士介绍称。

据悉,HithinkGPT已和大量包括但不限于银行、券商、会计师事务所、政府机构等客户开展合作,很快将会接入他们的系统。

“目前大模型的应用处在一个可以用,还不错的阶段,但距离好用,能准确解决实际问题尚有一定的距离。”在研发人士看来,需要解决的关键点除了“模型幻觉问题”和“安全合规采集问题”外,“如何降低推理成本,提升推理速度”以及“如何生成实际有用的,对用户有参考意义的具体建议,而并非泛化的‘安全回答’”也是亟待解决的问题。

不过研发人士也表示,其中一些问题有望在2024年迎来一些突破点。比如在模型回答方面,或将更加个性化,对于不同的用户画像、不同的上下文信息,模型能理解得更透彻,生成有深度、有逻辑的准确回答;对于意图不准确的问句,也有望能够自动进行澄清和确认。

目前,HithinkGPT大模型在智能投研、智能投顾等应用场景已经取得了一些进展,能够赋能投研工作的多个环节,并辅助投顾从业人员产出更多优质内容。

(编辑:徐一嘉)
实时要闻
更多
13:44
汽车拆解概念股午后持续走强 超越科技、华宏科技双双涨停
13:38
理想汽车累计交付突破100万辆
13:19
科创50指数午后飙涨 现涨超9%
12:40
特斯拉超级充电站突破全球6万桩
07:52
三家国有大行已下调存款挂牌利率 最高25BP
2024-10-17 22:25
周鸿祎:汽车数字安全已成为国家安全重要部分
2024-10-17 19:14
余承东:尊界将在广州车展亮相 明年春天上市
2024-10-17 19:13
贝莱德:将"适度增持"中国股市
2024-10-17 16:33
新华保险:前三季度保费收入1456.44亿元
2024-10-17 15:20
河南全省保交房项目已交付超25万套
2024-10-17 15:03
上海跨国公司地区总部达998家
2024-10-17 14:00
昆仑万维20CM涨停
2024-10-17 12:27
抖音:已与公安部等建立网络暴力线索反馈机制
2024-10-17 07:55
日本9月未季调商品贸易帐-2943亿日元
2024-10-16 19:14
链星成网!我国“千帆星座”将迎来常态化发射
2024-10-16 16:52
京东物流开始服务淘宝天猫商家
2024-10-16 16:49
华为再添一项脑机接口相关专利
2024-10-16 13:19
第55届全国药材药品交易会今天开幕
2024-10-16 12:17
阿里国际发布首个大规模商用翻译大模型
2024-10-16 07:44
联想推出AI Now:个人计算正在转变为AI个性化计算
13:44
汽车拆解概念股午后持续走强 超越科技、华宏科技双双涨停
13:38
理想汽车累计交付突破100万辆
13:19
科创50指数午后飙涨 现涨超9%
12:40
特斯拉超级充电站突破全球6万桩
07:52
三家国有大行已下调存款挂牌利率 最高25BP
2024-10-17 22:25
周鸿祎:汽车数字安全已成为国家安全重要部分
2024-10-17 19:14
余承东:尊界将在广州车展亮相 明年春天上市
2024-10-17 19:13
贝莱德:将"适度增持"中国股市
2024-10-17 16:33
新华保险:前三季度保费收入1456.44亿元
2024-10-17 15:20
河南全省保交房项目已交付超25万套
2024-10-17 15:03
上海跨国公司地区总部达998家
2024-10-17 14:00
昆仑万维20CM涨停
2024-10-17 12:27
抖音:已与公安部等建立网络暴力线索反馈机制
2024-10-17 07:55
日本9月未季调商品贸易帐-2943亿日元
2024-10-16 19:14
链星成网!我国“千帆星座”将迎来常态化发射
2024-10-16 16:52
京东物流开始服务淘宝天猫商家
2024-10-16 16:49
华为再添一项脑机接口相关专利
2024-10-16 13:19
第55届全国药材药品交易会今天开幕
2024-10-16 12:17
阿里国际发布首个大规模商用翻译大模型
2024-10-16 07:44
联想推出AI Now:个人计算正在转变为AI个性化计算
热门文章
日排行 周排行
全部予以注销!一夜之间多家招商系上市公司公布回购方案
银柿财经 10-17
1
金砖支付、华为云跨境系统陆续发布!跨境支付概念活跃
银柿财经 10-17
2
解读|制度如何影响经济繁荣?2024诺贝尔经济学奖缘何颁给他们仨
银柿财经 10-14
3
票据月度观察|有A股公司逾期金额过亿,协助法院执行也可导致逾期
银柿财经 10-16
4
浙江省上市公司并购重组推进大会在杭举办 唱响中国经济的光明论
银柿财经 10-16
5
旗下企业IPO接连失利,日本磁控“曲线救国”重组富乐德
银柿财经 10-17
6
国安部通报境外企业开展“非法测绘”,特斯拉、Mobileye等多方回应
银柿财经 10-17
7
微软Azure OpenAI将终止中国大陆的个人服务?最新回应来了
银柿财经 10-17
8
双成药业上演“天地天”行情 仅用5分钟从跌停到涨停
银柿财经 10-17
9
“题都刷完了,名却没报上!”哪些人在挤基金从业“考证潮”?
银柿财经 10-16
10