Kimi首个Agent开启小范围灰度测试 性能超OpenAI、Gemini

图灵汇官网

6月20日晚,月之暗面推出了名为Kimi-Researcher的首个代理产品,并启动了小范围测试。

这款产品基于端到端自主强化学习技术开发,在测试中表现优于Claude 4 Opus、Gemini 2.5 Pro和OpenAI Deep Research。与Gemini-Pro的Deep Research Agent相比,性能相当。

Kimi-Researcher能够独立安排任务步骤,最终给出完整结果。它没有复杂的提示语,也没有固定流程。在不断变化的环境中,它能自己判断如何处理信息,如何选择工具,以及哪些内容需要保存或舍弃。整个过程以任务是否完成为主要目标。

这款模型使用大量数据源,每条引用都可以直接查看来源,确保内容真实可靠,避免出现不准确的信息。

公司表示,Kimi-Researcher的基础模型和经过强化学习优化的版本将逐步开放,鼓励更多人参与相关研究。

本文来源: 图灵汇 文章作者: 闲话人工智能