华泰证券:从BloombergGPT看金融GPT机遇

来源:腾讯网 时间:2023-04-03 19:54:27

2023年3月30日,金融信息提供商彭博社发布了专为金融领域打造的大语言模型(Large Language Model,LLM)Bloomberg GPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。

华泰证券分析师谢春生(执业:S0570519080006)认为,掌握金融数据的国内厂商也有望复制Bloomberg GPT的路径,实现大语言模型在金融场景的有效赋能。


(相关资料图)

核心突破在于金融语料

尽管Bloomberg GPT的模型参数介于GPT-2与GPT-3之间。但BloombergGPT的金融垂直能力远超GPT系列。

分析师指出:

根据论文《Bloomberg GPT: A Large Language Model for Finance》的模型介绍显示,Bloomberg GPT同样基于典型的Transformer架构,Bloomberg GPT的模型参数介于GPT-2与GPT-3之间,GPT-2模型参数为1.5亿,GPT-3模型参数为1,750亿,Bloomberg GPT的模型参数为500亿。

官方论文《Bloomberg GPT: A Large Language Model for Finance》中的测试结果显示,Bloomberg GPT在执行金融任务上的表现超过现有的通用LLM模型,在通用场景上的表现与现有通用LLM模型能力基本持平。

尽管Bloomberg GPT的模型参数相较于GPT-3较小,但分析师表示,依托彭博社的大量金融数据源,Bloomberg GPT在预训练中获得了大量高质量金融数据,并对预训练数据进行了一系列的清洗、标注,Bloomberg GPT在通用能力与GPT-3基本持平的情况下,实现了金融垂直能力的大幅增强。

开拓开源模型+垂直数据的LLM新思路

Bloomberg GPT在开发方式上有何独特之处?分析师认为,在模型构建上,Bloomberg GPT显示出了卓越的创新,为国内金融数据公司开发大模型提供了有意义的路径参考。

具体而言,主要体现在五个方面:

1)垂直领域语言模型:过去的大语言模型多为基于通用文本训练的通用模型,垂直领域模型多为仅基于垂直领域数据训练垂直模型,Bloomberg GPT开创了通用+垂直的混合训练方法,让模型兼具通用性与专业性;

2)训练数据:过去的大语言模型的预训练数据很大程度上依赖于网页抓取数据,如C4、ThePile、Wikipedia等,Bloomberg自建了高质量的大规模金融数据集;

3)模型评估:Bloomberg在对模型进行了公共、金融NLP基准测试之外,还对模型进行了一系列基于Bloomberg内部任务的性能测试;

4)Token化(Tokenizer):将训练文本Token化是模型训练的关键步骤,Bloomberg使用Unigram模型取代greedymerge-basedsub-word模型,实现更智能的token化转换;

5)模型构建方法:以GPT-3、GPT-4为代表的大语言模型均由大型的专业人工智能团队开发,并且模型训练需要大量算力;受益于开源模型BLOOM的项目实践与Bloomberg在垂直领域高质量数据的深厚积累,Bloomberg GPT成功证明了一个中等规模的团队可以在垂直领域的特定数据上生产同样具有竞争力的大语言模型。

金融GPT未来可期

分析师认为,Bloomberg GPT未来有望应用于以下三大场景:

1)Bloomberg查询语言的生成:Bloomberg GPT可以将用户自然语言查询转换为有效的Bloomberg查询语言,使与金融数据的交互更加自然;

2)新闻标题的建议:Bloomberg GPT可以为Bloomberg的新闻应用程序提供支持,协助新闻工作者完成新闻短标题的撰写;

3)金融问答:得益于金融垂直领域知识的输入,Bloomberg GPT可以更加准确地回答金融相关的问题,例如在识别公司CEO的问答上,Bloomberg GPT的回答相较通用模型更为准确。

分析师指出,作为并非聚焦人工智金融垂直领域厂商,Bloomberg为金融GPT发展提供了具有参考价值的有益示范。

掌握丰富的金融垂直知识与现有AI产品布局,基于高质量的金融数据与开源的大语言模型,同样有机会打造专属金融场景的大语言模型,实现大语言模型在金融场景的有效落地,让大语言模型成为底层的AI操作系统。

本文主要观点来自华泰证券分析师谢春生(执业:S0570519080006)撰写的报告《从BloombergGPT看金融GPT机遇》,有删节

X 关闭

暴风城去诺森德线路在哪?魔兽世界暴风城前往诺森德有哪些方法?

暴风城去诺森德线路在哪?魔兽世界暴风城前往诺森德方法:在部落,有两架飞艇是可以飞往诺森德大陆的。在奥格瑞玛主城的中心,可以很清楚地

2023-06-26

DNF寻找叛徒任务怎么做?dnf寻找叛徒任务完成方法是什么?

DNF寻找叛徒任务怎么做?DNF寻找叛徒任务是一项非常有趣的任务,但对于新手来说可能有些困难。在这篇中,我们将为您提供一些有用的技巧和建

2023-06-26

三国杀荀攸技能是什么?三国杀荀攸怎么玩?

三国杀荀攸技能是什么?在三国杀中荀攸一共有两个技能,第一个技能是奇策:出牌阶段限一次,你可以将所有手牌当任意普通锦囊牌使用。第二个

2023-06-26

天地传说之鱼美人攻略是什么?天地传说之鱼美人怎么玩?

天地传说之鱼美人攻略是什么?荐使用D3DWINDOWS(方便看攻略)和变速精灵(调3 4倍用来加速游戏和256倍用来练级)辅助游戏,能够有效增强游戏幸

2023-06-26

物联网行业发展前景及市场前瞻

据国家数据统计,现阶段的互联网行业、电子商务行业、物联网及人工智能

2023-06-26

世界消息!桑葚市场前景及桑葚行业发展趋势分析2023

桑葚市场前景及桑葚行业发展趋势分析2023桑葚行业发展迅速,市场得以迅

2023-06-26

蓝莓行业可行性研究报告:蓝莓行业发展趋势与现状分析2023

蓝莓作为一种具有较高经济价值和广阔开发前景的新兴小浆果树种。在英国

2023-06-26

观察:芒果行业报告:芒果发展前景及市场销售情况分析2023

芒果行业报告:芒果发展前景及市场销售情况分析2023芒果是一个劳动密集

2023-06-26

水产品行业研究报告:水产品行业发展趋势与现状分析-当前短讯

水产品作为低脂且优质的蛋白质食物,还含有丰富的人体所需微量元素,符

2023-06-26

环球讯息:方家咀乡中心幼儿园开展系列活动推进清廉校园建设

为进一步推进“清廉校园”建设工作,树牢师幼廉洁意识,营造浓厚的校园

2023-06-26

联系方式:291 32 36@qq.com

Copyright © 1998-2015 by 微圈汇游戏网版权 所有 京ICP备12018864号-8

营业执照公示信息