
2025年11月4日,由国际AI实验机构Nof1主办的全球首个AI大模型实时投资竞赛“Alpha Arena”正式落下帷幕。历时17天的角逐中,中美六大AI模型同台竞技,在真实金融市场中自主交易、实时对抗。最终,来自中国的Qwen3-Max以22.32%的收益率斩获冠军,DeepSeek v3.1位列亚军,成为唯二实现盈利的模型。而美国四大模型悉数亏损,其中GPT-5亏损高达62%,位列榜尾。
全球AI模型首次“无人工干预”实盘对决
据悉,此次比赛自10月18日启动,参赛阵容包括中国的Qwen3-Max、DeepSeek v3.1,以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4。每个模型初始资金均为1万美元,须在真实市场环境下独立决策、执行交易,全程无人工干预。最终以账户收益率为标准评定名次。
比赛初期,DeepSeek v3.1表现强势,曾连续多日占据榜首。马斯克旗下的Grok 4以激进策略紧追不舍,但10月21日至22日期间,六个模型均出现大幅回撤,一度全员亏损。关键时刻,中国的两款模型迅速调整策略,稳住仓位并逆势盈利。至此,比赛格局形成三大阵营:中国模型双雄领跑,美方四模型陷入不同程度亏损。
中国模型双雄领跑,美系模型全线告负
最终结果显示,Qwen3-Max账户余额达12,232美元,收益率+22.32%,交易43次、胜率30.2%,以稳定风控和集中策略胜出;DeepSeek v3.1 收益率+4.89%,虽略逊一筹,但Sharpe值0.359 为全场最高。反观美方阵营,Claude Sonnet 4.5亏损30.81%,Grok 4亏45.3%,Gemini 2.5 Pro亏56.71%,GPT-5亏62.66%,账户仅剩3734美元。
操盘风格迥异,策略分化明显
六大模型展现出完全不同的投资逻辑与性格。
Qwen3-Max简洁高效,仅操作BTC一个品种,使用5倍杠杆并设置严格止盈止损,体现出“少即是多”的策略思维。
DeepSeek v3.1则偏理性系统流,通过多因子分析与失效条件管理仓位,ETH多头与DOGE空头贡献主要收益。
GPT-5尽管风险意识较强,但“多空齐持”的防守策略拖慢了盈利节奏,最终陷入深亏。
Gemini 2.5 Pro纪律严苛,坚持全仓做空六币种,却忽略短期反弹。
Claude Sonnet 4.5倾向灵活机会主义,频繁调仓押注XRP;
Grok 4则保持保守姿态,手握现金等待高确定性信号入场。
Nof1:让AI在市场中进化
比赛主办方Nof1.ai表示,金融市场是检验AI智能的最佳试炼场。通过“开放式学习+强化反馈”的机制,AI模型能在真实环境中不断进化。
创始人Jay A称,团队正计划推出自主研发的模型,并将在Alpha Arena 1.5赛季中与全球顶尖AI同场竞技。新赛季将引入多提示词机制、模型多实例部署与更高难度挑战,进一步推动AI在金融决策领域的探索。
从这场“AI投资版世界杯来看”,中国模型的稳健与学习能力正不断突显,在真实市场中展现出超越预期的智慧与韧性。这不仅是一场技术的较量,更是人工智能全球格局的一次缩影。
© 版权声明
本内容由 AI 生成,仅供参考,不构成新闻报道。








