①多家银行金融科技负责人对财联社表示,已经关注并开始研究DeepSeek对银行金融科技带来的影响。②随着DeepSeek等模型能极大降低训练和使用成本,对未来银行全面推广大模型应用会有很大的助力。③不过,现在大模型在银行体系还是处于开放探索阶段。
财联社2月5日讯(记者 梁柯志)DeepSeek横空出世之后,引发银行金融科技领域的高度关注。
多家银行金融科技负责人对财联社表示,已经关注并开始研究DeepSeek对银行金融科技带来的影响,其中兴业银行相关人士透露,该行已经在春节前做了测试。
2月5日,某股份行首席技术官对财联社表示,目前多数银行在大模型应用还以内部提效为主,对外部客户服务方面会更加谨慎。不过,随着DeepSeek等模型能极大降低训练和使用成本,对未来银行全面推广大模型应用会有很大的助力。
另一位大型股份行科技管理部负责人表示,该行正在深度研究DeepSeek,主要考虑到银行适用大语言模式有本地部署的考虑,一方面是安全方面要求,第二是业务场景的需求。此前研究比对多是境外的模型。
财联社记者注意到,江苏银行近日宣布成功本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型,分别运用于智能合同质检和自动化估值对账场景中,通过对海量金融数据的挖掘与分析。
国产大模型DeepSeek横空出世,国内银行纷纷测试
本轮热潮始于2024年12月26日,DeepSeek-V3正式发版,以其同效能、低成本引发国内外资本和科技领域的关注。
2月4日,浙商证券报告认为,其代表国产大模型推理能力提升,加速在应用端落地。DeepSeek最新版模型展现出来的优异能力,表明国内大模型推理能力提升到一个新的阶段,大模型在各领域的应用有望加速加速落地。浙商证券研报认为,DeepSeek给AI研究和企业端应用都将带来革新。
上述首席技术官表示,从行业来说,各家银行肯定都会深入研究这一系统,毕竟代表一个新的方向。短期来说,不会对金融科技产生质的变化。因此,对降低银行科技投资来说还为时尚早。长期来看,在大模型迅猛发展之后,找到与银行业务的结合点、突破点,带来更大的价值转化,才会降低投入成本。
《2024年中国金融科技创新发展洞察报告》显示,金融机构科技投入规模由2019年的2252.60亿元增长至2023年的3558.15亿元,年均增长14.48%。其中,商业银行科技投入规模保持在较高水平,占金融机构投入的比例稳步提升,从2019年的76.80%上升到2023年的77.50%。
上述股份行科技管理部负责人表示,DeepSeek在基础大模型之上,但客观来说并不是碾压式的创新,假期期间对DeepSeek尚未完成全面测试,还不能断定一定会采用它。实际上国内外也不时会出现新的模型和应用,但是作为银行也不能发现好的模型“马上就换”,要有一个过程。
该人士分析,有些银行金融科技应用大模型程度不高,此时采用DeepSeek或是“一个好的机会”。
银行大模型应用仍在开放探索
公开资料显示,2024年4月,DeepSeek大语言模型算法备案才通过;2024年5月7日,发布第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2;2024年6月17日,发布DeepSeek-Coder-V2;2024年12月13日,发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2。
2月1日以来,包括腾讯云、百度智能云和阿里云等均推出不同类型的DeepSeek模型应用服务。
上述首席技术官承认,目前银行在大模型研究和应用的成熟度还不够。此外,由于模型幻觉问题没有很好解决,在合规安全的要求也会很谨慎,这是大规模应用之前需要解决的障碍。
在企业应用端,浙商证券报告认为首先现有的B端应用将最先迎来AIAgent,B端应用有成熟的数据、场景,例如客服、营销类场景会较快布局活跃有效的智能代理服务。其次,随着低参数模型性能翻倍,将更适用于追求低能耗的端侧AI创新产品。
另一位股份行科技线人士表示,大模型基于数据黑盒输入输出,存在一定不可解释性,这对金融业务安全有影响,同时还有伦理逻辑的问题。不过,现在大模型在银行体系还是处于开放探索阶段,现在不存在验收的要求。
该人士认为,适合自己才是最好,部分银行已经在外部模型基础上开发和打磨自有模型,相信会成为未来银行金融科技的一种重要发展模式。