AI革命下一站：Anthropic与OpenAI斥巨资打造“虚拟员工”

王菁

2025-09-17 18:28:06

AI行业两家领先企业Anthropic和OpenAI正在尝试一种新方式，让人工智能模型具备类似人类员工的能力。他们通过模拟企业软件环境来训练AI，使其能够处理复杂的工作任务。

Anthropic计划在未来一年内投入10亿美元，建立专门用于AI训练的“健身房”。这个平台将提供高度仿真的办公场景，帮助AI掌握各种专业工具的使用方法。OpenAI的高管表示，未来整个经济体系可能都会成为AI学习的场所。

这些AI系统正在学习如何操作多种办公软件，包括客户管理系统、客服平台以及医疗记录系统等。目标是让它们能独立完成白领日常遇到的各种任务。

训练过程非常严格。研究人员不仅搭建了逼真的企业应用环境，还请来了各行业的专家作为导师，指导AI如何正确使用各类工具。这种培训方式成本很高，因为需要支付专家费用，同时还要构建虚拟办公空间。

目前，一些专家的时薪已经很高，部分人每小时收费超过90美元。预计未来几个月，顶尖专家的报酬还会继续上涨。

如果成功，这种训练方法可能会带来巨大的收益。企业可以出售能够接管电脑并完成任务的AI助手，或者开发更强大的企业级应用。

Anthropic的CEO称这些AI为“虚拟协作者”，它们可以与人类一起工作，熟练使用各种常用软件。

实现这一目标并不容易。例如，要让AI完成一个销售任务，它需要掌握多个系统的操作，包括客户筛选、寻找潜在客户、安排会议以及发送邮件等步骤。

为了确保AI真正掌握技能，研究人员会把任务拆分成多个步骤，并设定明确的检查标准。比如，是否按时间筛选客户，是否发送包含会议链接的邮件，是否更新客户状态等。

虽然这项技术还在发展阶段，但已有不少公司开始投资。Anthropic目前在强化学习环境上的预算比例较小，但随着效果显现，明年可能会大幅增加投入。

图灵公司已经建立了超过1000个模拟环境，覆盖多种应用场景。每个环境都有定制的任务示例和评估体系，帮助企业系统性地训练AI。

越来越多的公司进入这个领域，提供模拟环境和专业任务设计服务。一些初创企业也专注于服务顶级AI实验室，强化学习环境正成为一个新兴市场。

有人认为，这种方法类似于人类的学习过程，让AI在真实环境中成长。除了模拟环境，AI开发者还通过高难度问题来训练模型，如编程竞赛题或博士级别的学术问题。

数据标注公司也在不断升级，从招聘学生到聘请有丰富经验的专业人士。例如，图灵公司曾聘请NASA的数据科学家、能源部的化学家、医院的医生，甚至金融公司的高管，让他们完成实际任务，让AI观察学习。

举例来说，如果想让AI理解税率变化对财务的影响，公司会先让一位专家解决这个问题，得到一个具体答案，再让AI多次尝试，筛选出正确的结果进行训练。

OpenAI等大公司正在广泛收集这类案例，涵盖医疗、法律等多个领域。一位高管提到，他们希望未来整个经济都能成为AI学习的场所。这意味着AI可以通过记录专业人士的日常工作来不断提升自己。

本文来源：互联网文章作者：王菁

QuestMobile发布中国AI原生应用Top10：豆包、元宝、AQ入选