Kimi首个Agent开启小范围灰度测试性能超OpenAI、Gemini

闲话人工智能

2025-06-22 23:19:39

6月20日晚，月之暗面推出了名为Kimi-Researcher的首个代理产品，并启动了小范围测试。

这款产品基于端到端自主强化学习技术开发，在测试中表现优于Claude 4 Opus、Gemini 2.5 Pro和OpenAI Deep Research。与Gemini-Pro的Deep Research Agent相比，性能相当。

Kimi-Researcher能够独立安排任务步骤，最终给出完整结果。它没有复杂的提示语，也没有固定流程。在不断变化的环境中，它能自己判断如何处理信息，如何选择工具，以及哪些内容需要保存或舍弃。整个过程以任务是否完成为主要目标。

这款模型使用大量数据源，每条引用都可以直接查看来源，确保内容真实可靠，避免出现不准确的信息。

公司表示，Kimi-Researcher的基础模型和经过强化学习优化的版本将逐步开放，鼓励更多人参与相关研究。

灰度开启范围性能测试 Gemini OpenAI Agent Kimi

本文来源：图灵汇文章作者：闲话人工智能

杨正

2025-06-22

Kimi首个Agent开启小范围灰度测试 性能超OpenAI、Gemini