澳洲金融家又开始恐慌了吗? ChatGPT解锁新用法:破解美联储“谜语”预测股市走势(图)

在澳大利亚澳洲新闻




生成式AI风暴来袭,ChatGPT会抢走金融分析师的饭碗吗?

好消息是像ChatGPT这样的产品很有可能考不上CFA考试,敲响了各大金融机构的大门,坏消息是它们可以经济学和法律学位在某种程度上可以取代初级卖方分析师。

 Image

最新证据来自两篇最近发表的学术论文,研究工作人员通过ChatGPT解读了美联储声明中“鹰派和鸽派”的内容,以及该消息对股市利好还是利空。

结果表明,ChatGPT 表现相当出色,不仅超越了传统的分析方法,还击败了其他现有的生成式 AI 模型对手。

图片< /p>

破解美联储“谜底”,ChatGPT遥遥领先

4 月 10 日,里士满联储量化监督与研究小组的两名成员发表了一篇题为《ChatGPT 能否破译美联储的讲话》的论文,测试了 GPT-3 模型判断美联储态度的能力来自美联储的讲话。

两位研究人员从 FOMC 公告中随机抽取 500 句话,然后由人类判断为“鸽派”、“基本鸽派”、“中性”、“基本鹰派” " 或 "Hawk",对应的数字分别为 -1、-0.5、0、0.5 和 1。

这里值得一提的是,研究人员使用了五个类别而不是三个(“鸽派”、“中性”、“鹰派”),以测试 GPT 能否辨别美联储立场的细微差别。

图片

在为了提高人类参考组的准确率,这些句子分别由三个人类审阅者独立标注,计算每个标签下对应句子的数量,然后取三个结果的平均值。

图片

有了 ChatGPT,还有其他神经网络语言模型 (NLP),包括 Google Bert 大型模型、金融情感词典 Loughran & McDonald (LM)、Henry,以及 Mohammad 和 Turney ,一本日常语言中的情感词典。

测试分为两部分。研究人员先让机器考生在没有样本学习的情况下进行测试,然后让他们学习 400 个句子的分类,然后再处理剩下的 100 个句子。

结果表明,ChatGPT对美联储讲话的解读是所有机器候选中最接近人类的,无论是否是“裸考”。

先来看看“裸测”的结果。

GPT-3 的标签与人类最匹配,尤其是标签“dove”、“basic hawk”和“hawk”。

Bert 大大高估了“鸽派”句子的数量,而情感词典大大低估了“鸽派”或“基本上是鹰派”的“鸽派”句子的数量。

 Image

为了减少研究结果的误差,研究人员计算了平均绝对误差(MAE)和均方根误差(RMSE)结果,比较准确性和 Kappa 系数(用于一致性检查的指标)。

研究人员还使用 F1 分数和平衡准确度(均为机器学习模型评估指标)进一步提高研究的准确性。

结果表明,GPT-3的结果遥遥领先于其他机器。

它产生最小的 MAE 和 RMSE 误差值,最高的准确率和 Kappa 系数,甚至 F1 分数和平衡准确率也大多高于其他机器。

 Image

虽然Bert模型不如GPT-3 ,比情感词典好。

接下来,让我们看看充分学习后的测试结果。

不出所料,GPT-3又是第一,性能提升明显。

 Image

最引人注目的是,MAE误差值几乎是“裸考”分数的一部分。��,精度提升近1.5倍,Kappa系数提升一倍以上。

 Image

GPT-3 的性能真的很惊人。

以美联储 2013 年 5 月声明中的语言为例。

美联储表示:“总体而言,最近几个月劳动力市场状况有所改善,但失业率仍然居高不下。”

ChatGPT 的分类是“基本温和”,这与分析师的结果完全一致。

 Image

研究人员惊呼:

撇开分类不谈,GPT 模型解释为什么某个句子以某种方式被标记的能力是一种超越任何现有 NLP 模型的能力,对研究人员意义非凡。

在报告的最后,研究人员将 GPT-4 与 GPT-3 进行了比较,发现在大多数情况下,前者更擅长“破译”美联储演讲能力强。

以下面这句话为例,其中美联储说:

鉴于目前的通货膨胀率低于 2%,委员会将仔细监测实现通货膨胀目标的进展情况。

GPT-3判断为“中性”,GPT-4判断为“基本鸽派”,更接近分析师给出的“鸽派”饼”类别。

图片

Image

你能预测股票价格吗?

佛罗里达大学的两位研究人员最近发表了一篇题为“ChatGPT 可以预测股票价格趋势吗?”的文章Reward Predictability and Large Language Models” 论文。

基本上,这项研究是让 ChatGPT 判断新闻是好是坏或与公司股价无关。研究人员根据 ChatGPT 解读的结果预测公司股价的走势。

 Image

这实际上与解码美联储声明的研究大致相同。

研究人员提示 ChatGPT:

假装你是一位有股票推荐经验的金融专家,如果以下消息是好消息,请回答“是”,如果是坏消息,请回答“否”,否则,请回答“未知”

然后,研究人员要求 ChatGPT 用一句话简要说明该消息在短期/长期内对公司股价是好是坏。

研究人员将ChatGPT的答案转换为相应的数字,“是”、“否”和“未知”分别对应1、-1和0。如果一家公司在某一天有多个重大事件,研究人员会对这些数字进行平均。

最后,研究人员通过ChatGPT打分,对次日股票收益进行分析,并对得分进行线性回归分析。

注意,研究中使用的数据是2021年晚些时候的数据,因为这段时间的数据不包括在ChatGPT大数据训练中。

以甲骨文的一篇新闻为例:

Rimini Street(企业软件产品和服务提供商)在甲骨文的案件中被罚款 630,000 美元。

这个消息对 Oracle 来说是好是坏?

ChatGPT的回复:

Yes(对应数字为1),Rimini Street罚款的是可能会增强投资者对甲骨文保护其知识产权的信心,并增加对其产品和服务的需求。

因此,ChatGPT认为该消息利好甲骨文股价。

相比之下,Ravenpack 的负面情绪评分为 -0.52,表明该消息被认为是利空消息。

研究最终发现,ChatGPT 发布的情绪评分与股票走势在统计上存在很强的相关性。但是,GPT-1、GPT-2、Bert等更基础的模型无法准确预测。

结果还表明,ChatGPT ...�� 模型在预测股市回报方面优于现有的情绪分析方法,例如 RavenPack。

图片

Image

基于这一结果,研究人员得出结论也就是说,未来的研究应该侧重于理解大型语言模型 (LLM) 获得预测能力的机制。

通过确定像 ChatGPT 这样的模型在预测股票回报方面取​​得成功的原因,研究人员可以制定更有针对性的策略来改进这些模型并最大限度地提高它们在金融领域的效用。


澳洲中文论坛热点
悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
联邦政客们具有多少房产?
据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联

中文新闻,澳洲经济,时事,华人论坛动态,悉尼本地消息,墨尔本,珀斯,布里斯班,澳洲新闻,澳大利亚华人网,澳洲华人论坛

澳洲新闻

澳大利亚计划在2年内开始生产制导导弹

澳大利亚澳大利亚周三表示,将在 2025 年之前开始在国内生产导弹,比预期提前两年。这是对防御的广泛改革,以专注于远程打击能力。 周一,工党政府表示已接受一项国防审查建议,该建议称 ...

澳洲新闻

澳洲一季度通胀放缓 市场倾向不加息

澳大利亚澳大利亚的通胀率在第一季度从 33 年高位回落,生活成本增幅为一年多来最小,而核心通胀率低于预期,表明再次加息的压力较小。 Investors的反应是拉长了可能性(拉长了可能性,非专 ...