中国模型问鼎全球AI投资赛：Qwen3-Max夺冠，GPT-5惨亏六成垫底

2025年11月4日，由国际AI实验机构Nof1主办的全球首个AI大模型实时投资竞赛“Alpha Arena”正式落下帷幕。历时17天的角逐中，中美六大AI模型同台竞技，在真实金融市场中自主交易、实时对抗。最终，来自中国的Qwen3-Max以22.32%的收益率斩获冠军，DeepSeek v3.1位列亚军，成为唯二实现盈利的模型。而美国四大模型悉数亏损，其中GPT-5亏损高达62%，位列榜尾。

全球AI模型首次“无人工干预”实盘对决

据悉，此次比赛自10月18日启动，参赛阵容包括中国的Qwen3-Max、DeepSeek v3.1，以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4。每个模型初始资金均为1万美元，须在真实市场环境下独立决策、执行交易，全程无人工干预。最终以账户收益率为标准评定名次。

比赛初期，DeepSeek v3.1表现强势，曾连续多日占据榜首。马斯克旗下的Grok 4以激进策略紧追不舍，但10月21日至22日期间，六个模型均出现大幅回撤，一度全员亏损。关键时刻，中国的两款模型迅速调整策略，稳住仓位并逆势盈利。至此，比赛格局形成三大阵营：中国模型双雄领跑，美方四模型陷入不同程度亏损。

中国模型双雄领跑，美系模型全线告负

最终结果显示，Qwen3-Max账户余额达12,232美元，收益率+22.32%，交易43次、胜率30.2%，以稳定风控和集中策略胜出；DeepSeek v3.1 收益率+4.89%，虽略逊一筹，但Sharpe值0.359 为全场最高。反观美方阵营，Claude Sonnet 4.5亏损30.81%，Grok 4亏45.3%，Gemini 2.5 Pro亏56.71%，GPT-5亏62.66%，账户仅剩3734美元。

操盘风格迥异，策略分化明显

六大模型展现出完全不同的投资逻辑与性格。
Qwen3-Max简洁高效，仅操作BTC一个品种，使用5倍杠杆并设置严格止盈止损，体现出“少即是多”的策略思维。
DeepSeek v3.1则偏理性系统流，通过多因子分析与失效条件管理仓位，ETH多头与DOGE空头贡献主要收益。
GPT-5尽管风险意识较强，但“多空齐持”的防守策略拖慢了盈利节奏，最终陷入深亏。
Gemini 2.5 Pro纪律严苛，坚持全仓做空六币种，却忽略短期反弹。
Claude Sonnet 4.5倾向灵活机会主义，频繁调仓押注XRP；
Grok 4则保持保守姿态，手握现金等待高确定性信号入场。

Nof1：让AI在市场中进化

比赛主办方Nof1.ai表示，金融市场是检验AI智能的最佳试炼场。通过“开放式学习+强化反馈”的机制，AI模型能在真实环境中不断进化。
创始人Jay A称，团队正计划推出自主研发的模型，并将在Alpha Arena 1.5赛季中与全球顶尖AI同场竞技。新赛季将引入多提示词机制、模型多实例部署与更高难度挑战，进一步推动AI在金融决策领域的探索。

从这场“AI投资版世界杯来看”，中国模型的稳健与学习能力正不断突显，在真实市场中展现出超越预期的智慧与韧性。这不仅是一场技术的较量，更是人工智能全球格局的一次缩影。