近日,由用友主办的2024全球商业创新大会在北京隆重召开。中国工商银行(以下简称“工商银行”)首席技术官吕仲涛出席企业数智化价值峰会,并发表题为《金融行业AI大模型工作实践》的精彩演讲(文末查看演讲视频)。吕仲涛表示,工商银行体系性推动大模型企业级技术能力建设,依托“三大支柱”“1+X范式”“两全平台”“全域生态”建设思路,立足于全栈国产化技术,星空体育下载建成集基建、算力、算法、数据、工具、能力、安全、应用、生态于一体的企业级千亿金融大模型技术体系,内外协同赋能,打造“人工智能+金融”新生态。
人工智能在1956年被首次提出后,历经多次技术变革。2022年,ChatGPT催生了人工智能新浪潮,具备更强通用性的理解与生成能力的大模型让通用人工智能的发展迎来了曙光。
政策层面,2023年中央金融工作会议强调,要做好数字金融大文章。2024年政府工作报告也提出了数字经济创新发展,加快发展新质生产力,开展人工智能+行动,标志着人工智能已经上升为国家战略。
在政策和业务需求双向推动下,工行建成同业首个全栈自主可控的千亿级AI大模型技术体系,实现在多个金融业务领域的创新应用。
吕仲涛指出,工商银行体系性推动大模型企业级技术能力建设,依托“三大支柱”“1+X范式”“两全平台”“全域生态”建设思路,立足于全栈国产化技术,建成集基建、算力、算法、数据、工具、能力、安全、应用、生态于一体的企业级千亿金融大模型技术体系,内外协同赋能,打造“人工智能+金融”新生态。
在算力底座方面为确保技术供应链可靠,金融行业需要走出一条无模板可借鉴的国产大模型应用之路,实现大模型分钟级弹性启动,具备TB级数据,一个月内完成千亿大模型全参稳定训练的能力。另外,工商银行在国产化算力基础上,全面兼容十余个业界领先的大模型技术生态,能够有效应对大模型技术的快速演进。
在算法矩阵方面工商银行以共享复用、资源节约、成本效益最优为准则,采用商用+开源并行路线,利用海量金融数据和金融大模型预训练微调等技术,建成多层次、多模态、多模型协同融合的千亿级金融大模型算法矩阵,实现不同参数不同能力模型的质优调控,满足金融业务场景复杂多样化的需求。
在知识工程方面保障大模型的训练量是重中之重,其关键在于数据。大模型时代对于数据质量、新鲜度、跨专业领域的综合运用以及严谨性等方面都有着更高要求,需要打破专业知识运营各自为政的现状。基于此,工商银行打造出一套适配大模型的企业级金融知识工程,建成世界、行业、领域、企业、任务五层知识架构,构建出质量优、覆盖广的万亿Token金融数据级,数据规模达到1.2TB。利用数据智能处理技术,创新打造采集、清洗、管理、应用知识工程全生命周期智能化流水线,革新金融知识高效运营模式,整体数据生产效率较传统模式提升十倍以上,为适配大模型时代的数据要素市场建设贡献智慧。
工商银行系统性总结提炼“1+X”大模型应用范式。其中“1”指1 个 全 能 融 智 能 中 枢 应 范 式,利用大模型强大的自然语言理解能力实现复杂任务拆解、规划、工具调用能力,可以像人类一样处理更全面更复杂的任务。另外,为了解决大量规范文档知识查找难、海量咨询信息获取难星空体育app官网、数据分析门槛高、文档编写效率低等高频问题,工商银行打造了知识检索、数据分析、文档编写、智能搜索等“X种专业范式”,端到端赋能业务创新应用。截至目前,金融复杂任务执行成功率90%,金融知识问答满意度90%,对线%以上,均达到业界领先水平。
此外,综合考虑不同业务部门创新动力差异,为确保大模型应用由简到易、规模化有序推进,工商银行提出两阶六步金融大模型应用创新方法论、“3-1-N”基于范式的AI规模化转换方法论。
两阶六步方法论运用科技业务融合创新机制,疏通技术业务赋能领域的整体价值链,明确用大模型做什么,怎么做。
二是“3-1-N”方法论,首选简单容易突破的业务领域孵化一个精品标杆案例,打磨两个相似场景,提炼出典型端到端的大模型应用范式,进而进行全行相似场景的推广,形成精品标杆场景打造沉淀标准应用范式能力,全域规模化推广的最佳实践。
目前,已实现各个业务领域规模化推广,覆盖20多个业务领域,80多个业务场景。
呂仲涛指出,大模型本质是一个海量参数的深度学习算法。由于计算复杂度高,推理结果不可预知等因素,其应用存在两方面风险。
一是技术固有风险。例如,大模型生成的内容看起来合乎逻辑,但事实并非真实甚至是捏造的事实;二是恶意利用风险。例如利用图文生成、视频生成等能力欺骗业务场景、业务系统,用AI攻击AI。金融机构要关注大模型技术滥用、误用所带来的安全冲击,并提前做好预防措施,保障金融机构的信息安全。
针对上述风险,在大模型逐步深度应用过程中,工商银行从模型安全、数据安全、应用安全等三个方面建立全域守护的安全平台。如模型合规可靠方面,工商银行在网信办已备案大模型基础上构建金融安全专项测试级,涵盖金融安防、金融知识理解等一万余个问答对数据,确保模型可靠可用。应用可控可用方面,建立专项的知识库,通过知识检索、红线问题代答等方式进行客观作答,实现应用输出结果的可信可查。
呂仲涛认为,未来大模型在金融行业的应用可从如下四个方面进行:一是做深大模型技术支撑能力。金融机构要根据自身体量围绕大模型的算力算法和数据三个方面开展人工智能大模型企业级技术能力的建设;二是做大数据资产建设。大模型的应用离不开优质的数据训练,金融机构应重视数据资产储备与积累,关注数据资产的建设问题,在数据采集、存储、分析、应用多个阶段建立完善的数据管理办法,以数据驱动为核心理念,打破部门壁垒,推动数据共享协作共治;三是做强大模型人才队伍建设。AI大模型业务应用成效是前期投入的集中映射,金融机构应该培养更多的既懂业务又通技术的复合型人才,可充分挖掘大模型内核知识潜力,打造更多的突破性场景;四是加快跨行业联合创新。大模型所涉及的算力、算法等相关核心技术尚处于快速发展期,金融行业需加深与头部科研机构企业的联合创新,持续保持资源投入,加速大模型技术在金融行业的研究和创新应用,增强我国数字经济发展的国际竞争力。