
最新研究显示,多款大型人工智能模型在极短时间内实现了通过CFA三级考试的突破,这标志着AI在高阶金融推理领域取得了重要进展。此前,论述题一直被视为AI的重大障碍,但纽约大学斯特恩商学院联合AI财富管理平台GoodFin的研究团队证实,借助“思维链提示”技术,部分前沿推理模型已成功攻克这一瓶颈。
AI冲破CFA三级难关
此次研究覆盖23个大型语言模型,旨在检验它们是否具备完成专业金融决策所需的复杂推理能力和风险分析能力。研究结果显示,包括o4-mini、Gemini 2.5 Pro和Claude Opus在内的先进模型,通过应用“思维链提示”技术顺利通过了CFA三级模拟考试。相比之下,人类考生通常需要数年时间,并投入约1000小时系统学习才能获得同样成果。
从瓶颈到突破
过去的研究曾指出,虽然AI可以顺利通过CFA一级与二级考试,但三级考试中的论述题一直难以突破。随着AI算法和提示技术的进步,这一障碍已被成功克服。前沿推理模型利用“思维链提示”方法,有效处理了复杂论文题型,实现了考试成绩的全面提升。
模型表现差异显著
在不同模型的对比中,表现差异明显。Gemini 2.5 Pro在论述题评分中以3.44分的成绩领先,同时在综合得分(选择题与论述题结合)中以2.1分位居榜首。国产KIMI K2模型则在多选题环节表现突出,正确率高达78.3%,超越谷歌的Gemini 2.5 Pro与GPT-5。
提示策略与效率分析
研究团队采用零样本、自我一致性和自我发现三种提示策略,其中自我一致性策略获得了73.4%的最佳表现评分。在成本效益方面,Llama 3.1 8B Instant以5468分成为最佳效率模型,而Palmyra Fin以平均0.3秒的响应时间拔得速度头筹。
AI替代人类的局限
尽管AI在标准化考试中成绩亮眼,但业内专家仍指出,其在情境理解、意图判断等方面存在局限。GoodFin创始人兼首席执行官Anna Joo Fee表示:“机器尚难以捕捉客户的肢体语言与微妙暗示,这是人类独有的优势。”因此,AI虽能辅助金融决策,但完全替代专业金融人员仍需时间与技术进一步发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。