最近,AI 领域掀起了一波热潮。一场名为“投资直播”的活动在各大 AI 社群中引发关注。人们密切关注六个 AI 模型的交易表现,讨论的热情甚至超过了对股票的关注。这是一场真实的资金投入,AI 之间展开了一场投资较量。
由初创公司 Nof1 发起的“Alpha Arena”测试,并非虚拟操作。主办方为每个模型提供了一万美元的启动资金,让它们在真实市场中进行数字货币交易。整个过程被实时直播,收益情况和交易思路也同步展示。
目前参与比赛的有 DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro 和 GPT 5 六个模型,其中包括三家国外头部模型和两家国内模型。比赛从美东时间 10 月 18 日开始,持续两周,到 11 月 3 日结束。
真实市场变化无常,AI 也无法保证稳定盈利。正如主办方所说,“市场是智力的终极考验”。
比赛进行了四天,市场波动明显。前三天,DeepSeek 收益率一度接近 40%,盈利超过 4000 美元。但随着大盘下跌,它也损失部分收益,目前收益率保持在 10% 左右,仍然排在第一。
观察这四天的收益变化,DeepSeek 表现较为稳定,大部分时间领先。前两天 Grok 4 曾经接近 DeepSeek,排名第二,但其交易方式激进,随后受到市场影响,收益大幅下降。Claude 则从第三名上升至第二,收益紧跟 DeepSeek。
其他三个模型大多处于亏损状态。最初几天,Gemini 2.5 亏损超过 30%,而今天 GPT 5 的亏损超过 40%,损失超过 5900 美元。阿里通义的 Qwen3 Max 排在中间,亏损超过 13%,虽然曾短暂盈利,但整体仍处于亏损状态。
通过这几天的比赛,可以看出各个模型有不同的风格,就像真正的交易员一样。
DeepSeek 的稳定表现被认为与其背景有关,因为其母公司幻方是量化机构。它在开盘时就全仓买入,策略简单直接,不做调整,之后价格持续上涨。
相比之下,Gemini 2.5 被认为交易风格类似散户,策略频繁变化,买卖次数多,导致交易成本高。有网友调侃说,它太聪明反而弄巧成拙。
Grok 4 的交易风格比较激进,持仓多个标的,跟踪趋势频繁,但波动较大。Claude 虽然分析能力强,但决策犹豫,经常调仓失败。Qwen3 每天集中投资一个标的,使用 20 倍杠杆,一旦方向错误就会造成巨大损失。
比赛才刚开始四天,胜负尚未定论。一些网友已经开始学习 DeepSeek 的操作方式,甚至有人考虑跟随 AI 进行交易。
将投资交给 AI 是否可靠?一些金融从业者持谨慎态度。他们认为,AI 缺乏对用户个人情况的了解,无法做出合适的建议。此外,AI 只能基于已有数据进行分析,不能预测未来。
社交平台上,不少用户尝试让 AI 推荐股票,有些人确实获得了不错的收益。但这通常是因为用户输入的信息已经比较专业,AI 在此基础上给出建议。
行业人士普遍认为,AI 的优势在于能够冷静地分析数据,快速整合信息。但 AI 无法预测未来,也不掌握未公开的市场动态。理性工具与人类智慧的结合可能是更好的选择。