拥抱新技术浪潮大模型助力金融行业变革

2023-12-09 18:44:14来源：中国证券网

分享到：

主持人：

郑明，CFA协会亚太金融研究平台（ARX）上海地区代表

圆桌嘉宾：

阿里云全球技术服务部数据智能团队负责人黄高攀

中欧基金执行董事、信息技术总监贾建国

鹏城实验室研究员（正高）/博导、港中文深高金客座教授、原平安基金量化投资总监孙东宁

上海恒生聚源数据服务有限公司首席数据专家张洋洋

上证报中国证券网讯（记者朱妍）自ChatGPT发布以来，大模型在金融领域能发挥多大的能效，引发了行业内的高度关注，技术带来的革新浪潮正席卷而来。

在金融行业内，大模型发展到了怎样的程度，面临着怎样的挑战？又具有怎样的远大前景？12月8日，在2023滴水湖新兴金融年度大会“数字金融打造全球核心竞争力”分论坛上，来自各大机构的行业大咖就“金融大模型的构建与挑战”话题展开了热烈讨论。

大模型助力金融行业变革

对于当下大模型在金融领域的应用，多位人士表示，大模型在投资端、客户端等方面已经有落地应用，在提高数据、投资效率的同时，也提供了更好的金融服务。

孙东宁表示，大模型、人工智能在量化领域有着非常大的应用，包括数据收集与管理、信号挖掘、组合构建，交易实现与风险管理。以数据收集为例，过去在量化投资中，用的主要是结构化数据，比如财务数据、量价数据；而文本数据、舆情数据、研报数据这些非结构化数据，若要进行量化处理、纳入模型，其人力、时间和资金成本较高。但大模型出现后，这些数据收集与处理的效率显著提升，另类数据变得“不另类”了。

贾建国认为，从投资角度来说，研究、投资、风险、控制、交易、运营这5个涉及到自然语言处理的环节，大模型都可以发挥作用。另外，大模型还是很好的“投资顾问助手”，能适配客户的风险接受程度、投资喜好，选出适合投资者的产品。不过，“最后一公里”的事还是需要投资顾问来做，大语言模型还不能直接面客。

提及金融大模型的构建离不开高质量语料库的采集，张洋洋表示，基于聚源多年的数据经验，金融场景大模型有其独有的特性。要构建高质量语料库，先要从应用端的具体场景出发，进行数据规划，对语料数据进行合理的归集并管理，这需要考虑到语料背后的权属、可被应用的场景、安全等级等因素。语料数据的合理归集和管理，是大模型高质量语料库建设的前提，而对归集后的语料进行基于具体场景的数据治理，是被高效应用的基础。对不同的语料数据品类，构建其适用的质量控制手段，是大模型能够被达成有效利用的关键。

黄高攀也表示，要得到高质量的语料，首先是收集过程需要有统一的语料收集平台来管控文本、语音视频、结构化数据；其次是语料的高质量提取，包括文档解析和清洗、数据去重、低质量数据的过滤，最后根据场景需求构建高质量数据集。他认为，整个过程中，有两点很关键，有没有高效的AI服务平台，以及是不是和场景需求相匹配。

大模型迎接风险和挑战

作为一种新兴事物，在大模型为金融行业带来向好变化的同时，未来在应用过程中，又存在怎样的风险和挑战？

张洋洋认为，金融是服务大众的，大模型在金融领域的应用过程当中，具有基于其自身特性的要求，其中数据安全问题需被重点关注。如今金融机构积极投入大模型的应用研发，并取得了一定的成果，但在对公众服务时，面临着更强的监管合规要求。比如大模型当下还没法完全保证回答的“安全性”，且存在一些数据版权的问题。

黄高攀也表示，当前大模型存在一定的“幻觉现象”，需要借助一些知识检索等技术来减少这类现象，否则会给大模型的使用带来很大的困扰，这在金融行业也一样。

贾建国认为，目前大模型在算力、产品解决方案、人才上都面临着一些挑战。以产品解决方案为例，如今大语言模型的数量之多带来了很大的选择困难，但又不可能每个都去尝试一遍，这造成了很大的资本浪费。

尽管面对诸多风险和挑战，多位人士仍表示了对金融大模型应用前景的期待。孙东宁表示，大语言模型叠加时间序列大模型，未来一定会在量化投资各个环节上起到非常大的助力，金融机构应大力拥抱这些大模型。

贾建国也表示，大模型可能会引领“新范式”的产生，所有人或将从中受益，它确实能够帮助金融行业扩大产能、提高工作效率，在一定程度上成为公司“助手”。