AI行业两家领先企业Anthropic和OpenAI正在尝试一种新方式,让人工智能模型具备类似人类员工的能力。他们通过模拟企业软件环境来训练AI,使其能够处理复杂的工作任务。
Anthropic计划在未来一年内投入10亿美元,建立专门用于AI训练的“健身房”。这个平台将提供高度仿真的办公场景,帮助AI掌握各种专业工具的使用方法。OpenAI的高管表示,未来整个经济体系可能都会成为AI学习的场所。
这些AI系统正在学习如何操作多种办公软件,包括客户管理系统、客服平台以及医疗记录系统等。目标是让它们能独立完成白领日常遇到的各种任务。
训练过程非常严格。研究人员不仅搭建了逼真的企业应用环境,还请来了各行业的专家作为导师,指导AI如何正确使用各类工具。这种培训方式成本很高,因为需要支付专家费用,同时还要构建虚拟办公空间。
目前,一些专家的时薪已经很高,部分人每小时收费超过90美元。预计未来几个月,顶尖专家的报酬还会继续上涨。
如果成功,这种训练方法可能会带来巨大的收益。企业可以出售能够接管电脑并完成任务的AI助手,或者开发更强大的企业级应用。
Anthropic的CEO称这些AI为“虚拟协作者”,它们可以与人类一起工作,熟练使用各种常用软件。
实现这一目标并不容易。例如,要让AI完成一个销售任务,它需要掌握多个系统的操作,包括客户筛选、寻找潜在客户、安排会议以及发送邮件等步骤。
为了确保AI真正掌握技能,研究人员会把任务拆分成多个步骤,并设定明确的检查标准。比如,是否按时间筛选客户,是否发送包含会议链接的邮件,是否更新客户状态等。
虽然这项技术还在发展阶段,但已有不少公司开始投资。Anthropic目前在强化学习环境上的预算比例较小,但随着效果显现,明年可能会大幅增加投入。
图灵公司已经建立了超过1000个模拟环境,覆盖多种应用场景。每个环境都有定制的任务示例和评估体系,帮助企业系统性地训练AI。
越来越多的公司进入这个领域,提供模拟环境和专业任务设计服务。一些初创企业也专注于服务顶级AI实验室,强化学习环境正成为一个新兴市场。
有人认为,这种方法类似于人类的学习过程,让AI在真实环境中成长。除了模拟环境,AI开发者还通过高难度问题来训练模型,如编程竞赛题或博士级别的学术问题。
数据标注公司也在不断升级,从招聘学生到聘请有丰富经验的专业人士。例如,图灵公司曾聘请NASA的数据科学家、能源部的化学家、医院的医生,甚至金融公司的高管,让他们完成实际任务,让AI观察学习。
举例来说,如果想让AI理解税率变化对财务的影响,公司会先让一位专家解决这个问题,得到一个具体答案,再让AI多次尝试,筛选出正确的结果进行训练。
OpenAI等大公司正在广泛收集这类案例,涵盖医疗、法律等多个领域。一位高管提到,他们希望未来整个经济都能成为AI学习的场所。这意味着AI可以通过记录专业人士的日常工作来不断提升自己。