谁家 AI 用一万美元赚翻了？DeepSeek 第一，GPT-5 垫底

2025-10-22 20:35:00

最近，AI 领域掀起了一波热潮。一场名为“投资直播”的活动在各大 AI 社群中引发关注。人们密切关注六个 AI 模型的交易表现，讨论的热情甚至超过了对股票的关注。这是一场真实的资金投入，AI 之间展开了一场投资较量。

由初创公司 Nof1 发起的“Alpha Arena”测试，并非虚拟操作。主办方为每个模型提供了一万美元的启动资金，让它们在真实市场中进行数字货币交易。整个过程被实时直播，收益情况和交易思路也同步展示。

目前参与比赛的有 DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro 和 GPT 5 六个模型，其中包括三家国外头部模型和两家国内模型。比赛从美东时间 10 月 18 日开始，持续两周，到 11 月 3 日结束。

真实市场变化无常，AI 也无法保证稳定盈利。正如主办方所说，“市场是智力的终极考验”。

比赛进行了四天，市场波动明显。前三天，DeepSeek 收益率一度接近 40%，盈利超过 4000 美元。但随着大盘下跌，它也损失部分收益，目前收益率保持在 10% 左右，仍然排在第一。

观察这四天的收益变化，DeepSeek 表现较为稳定，大部分时间领先。前两天 Grok 4 曾经接近 DeepSeek，排名第二，但其交易方式激进，随后受到市场影响，收益大幅下降。Claude 则从第三名上升至第二，收益紧跟 DeepSeek。

其他三个模型大多处于亏损状态。最初几天，Gemini 2.5 亏损超过 30%，而今天 GPT 5 的亏损超过 40%，损失超过 5900 美元。阿里通义的 Qwen3 Max 排在中间，亏损超过 13%，虽然曾短暂盈利，但整体仍处于亏损状态。

通过这几天的比赛，可以看出各个模型有不同的风格，就像真正的交易员一样。

DeepSeek 的稳定表现被认为与其背景有关，因为其母公司幻方是量化机构。它在开盘时就全仓买入，策略简单直接，不做调整，之后价格持续上涨。

相比之下，Gemini 2.5 被认为交易风格类似散户，策略频繁变化，买卖次数多，导致交易成本高。有网友调侃说，它太聪明反而弄巧成拙。

Grok 4 的交易风格比较激进，持仓多个标的，跟踪趋势频繁，但波动较大。Claude 虽然分析能力强，但决策犹豫，经常调仓失败。Qwen3 每天集中投资一个标的，使用 20 倍杠杆，一旦方向错误就会造成巨大损失。

比赛才刚开始四天，胜负尚未定论。一些网友已经开始学习 DeepSeek 的操作方式，甚至有人考虑跟随 AI 进行交易。

将投资交给 AI 是否可靠？一些金融从业者持谨慎态度。他们认为，AI 缺乏对用户个人情况的了解，无法做出合适的建议。此外，AI 只能基于已有数据进行分析，不能预测未来。

社交平台上，不少用户尝试让 AI 推荐股票，有些人确实获得了不错的收益。但这通常是因为用户输入的信息已经比较专业，AI 在此基础上给出建议。

行业人士普遍认为，AI 的优势在于能够冷静地分析数据，快速整合信息。但 AI 无法预测未来，也不掌握未公开的市场动态。理性工具与人类智慧的结合可能是更好的选择。

本文来源：图灵汇文章作者：

返乡创业潮正在进行时