最近,很多初创企业和科技巨头都在探索一种叫做“Agent型商务”的概念。这个术语指的是让AI代理代表用户完成具体任务,比如购物或者订酒店。虽然AI搜索能帮助人们找到合适的礼物或酒店,但真正让AI完成购买或预订却并不容易。
一家成立八年的公司认为自己找到了解决办法。这家公司名叫AUI,由Ohad Elhelo和Ori Cohen于2017年创立。他们推出了名为“Agent语言模型”的Apollo-1产品,目前正准备对外发布。与OpenAI、Google和Anthropic等公司的类似产品相比,Apollo-1在执行任务方面表现更稳定。
AUI已经获得4500万美元的投资。前三年里,他们收集了大约6万人提供的任务操作数据,这些数据记录了不同方式完成任务的过程。这些信息成为Apollo-1研发的基础。
今年晚些时候,AUI将开放Apollo-1的访问权限,企业可以使用它来开发自己的智能代理系统。
例如,OpenAI最近推出的ChatGPT智能体仍然处于测试阶段,官方提醒用户不要轻易输入敏感信息。很多公司正在努力防止AI代理滥用权限或泄露数据。
Apollo-1采用了一种叫“神经符号推理”的技术,结合了传统AI的逻辑推理能力和大语言模型的处理能力。这种方式让AI在执行任务时更加可靠。
AUI的CEO Elhelo表示,虽然大语言模型适合生成对话内容,但它们的行为难以预测,这使得在实际应用中难以保证准确性和稳定性。而神经符号推理可以让AI按照设定规则进行判断,这对企业来说更有吸引力。
神经符号方法近年来受到关注,一些开发者尝试用它提高系统的可靠性,以便向金融和政府等行业提供服务。不过,也有专家对这种方法持保留态度,认为它和深度学习不太兼容。
根据一项测试,Apollo-1在处理现实任务方面比Claude 4等其他AI代理表现更好。测试包括修改航班预订、查询新航班等操作。AUI称Apollo-1的成功率超过90%,而Claude只有60%。
Apollo-1还在其他任务中表现出色,比如通过Google Flights订票,或者用Rufus聊天机器人在亚马逊上购物。
Elhelo希望这项技术能吸引银行、航空公司、保险公司和零售商等需要高可靠性的企业。Apollo-1会逐步展示它的思考过程,让开发者和运营人员了解其行为逻辑,并设置规则,比如在退款前检查公司政策。
AUI还与Google Cloud达成合作,允许他们的客户使用Apollo-1来驱动自己的聊天机器人和智能代理。Elhelo表示,未来还可以扩展到语音模式等更多应用场景。
他说:“它可以提供清晰的可见性,让公司真正信任它。”