赞
踩
我们研究了一种大型语言模型(LLM)是否能够像专业人类分析师一样成功地进行财务报表分析。我们向GPT-4提供标准化且匿名的财务报表,并指示模型分析这些报表以预测未来的收益变化方向。即使在没有任何叙述性或行业特定信息的情况下,LLM在预测收益变化方面的表现优于财务分析师。LLM在分析师通常表现不佳的情况下表现出相对优势。此外,我们发现LLM的预测准确性与经过专门训练的最先进机器学习模型的表现相当。LLM的预测并非来自其训练数据的记忆。相反,我们发现LLM生成了关于公司未来表现的有用见解。最后,基于GPT预测的交易策略比基于其他模型的策略产生了更高的夏普比率和阿尔法。综上所述,我们的研究结果表明,LLM可能在决策过程中发挥重要作用。
本文探讨了大语言模型(LLM),特别是GPT-4,在财务报表分析中的能力。财务报表分析是一项需要批判性思维、推理和判断的传统定量任务。
数据与模型:
实验设计:
主要发现
实践意义
结论
GPT展示了在财务报表分析中的卓越能力,达到了甚至超越了专业机器学习模型的表现。这表明LLMs在金融领域具有很大的应用潜力,值得投资者和监管者关注。未来的研究应进一步探讨AI在实际金融决策中的影响。
该图描述了论文中使用的baseline模型及预测方法
基于上一年财务报表发布后第一个月的预测,分析师的准确率为 52.71%,F1 分数为 54.48%,这在预测一年后的收益变化方向时优于基于简单模型的预测(准确率 = 49.11%,F1 分数 = 53.02%)。然而,这些结果也重申了一个观点,即收益变化非常难以预测,即使是对复杂的金融分析师也是如此。
正如预期的那样,分析师的预测准确率在 t+1 年内随着时间的推移有所提高,分别在第三个月和第六个月的预测中达到了 55.95% 和 56.58%。转向 GPT 的预测,我们观察到以下几点:
使用简单的提示指示 GPT 分析财务报表并预测未来收益方向时,模型的准确率为 52.33%,F1 分数为 54.52%。因此,在没有 CoT 推理的情况下,模型的性能与财务报表发布后第一个月的分析师共识预测相当。然而,当我们利用基于 CoT 的 GPT 预测时,性能显著提高。通过链式思维提示,GPT 达到 60.35% 的准确率,相比财务报表发布后一个月的分析师预测提高了 7 个百分点。这个差异在 1% 的水平上具有统计显著性。
因为我们没有向语言模型提供任何分析师可获得的叙述性或背景信息,除了资产负债表和损益表。综上所述,我们的结果表明,即使没有任何特定的叙述性背景,GPT 也可以通过财务报表分析超过人类分析师。我们的结果还强调了类似人类的逐步分析的重要性,这使得模型能够遵循人类分析师通常执行的步骤。相比之下,仅仅指示模型分析复杂的财务报表并不会产生强有力的预测结果。
I ( i n c o r r e c t = 1 ) i t = β X i t + δ y e a r + δ i n d + ϵ i t I(incorrect = 1)_{it} = \beta X_{it} +\delta_{year}+\delta_{ind}+ \epsilon_{it} I(incorrect=1)it=βXit+δyear+δind+ϵit
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。