速递|这家初创公司正在教AI Agent如何真正完成任务

图灵汇官网

最近,很多初创企业和科技巨头都在探索一种叫做“Agent型商务”的概念。这个术语指的是让AI代理代表用户完成具体任务,比如购物或者订酒店。虽然AI搜索能帮助人们找到合适的礼物或酒店,但真正让AI完成购买或预订却并不容易。

一家成立八年的公司认为自己找到了解决办法。这家公司名叫AUI,由Ohad Elhelo和Ori Cohen于2017年创立。他们推出了名为“Agent语言模型”的Apollo-1产品,目前正准备对外发布。与OpenAI、Google和Anthropic等公司的类似产品相比,Apollo-1在执行任务方面表现更稳定。

AUI已经获得4500万美元的投资。前三年里,他们收集了大约6万人提供的任务操作数据,这些数据记录了不同方式完成任务的过程。这些信息成为Apollo-1研发的基础。

今年晚些时候,AUI将开放Apollo-1的访问权限,企业可以使用它来开发自己的智能代理系统。

例如,OpenAI最近推出的ChatGPT智能体仍然处于测试阶段,官方提醒用户不要轻易输入敏感信息。很多公司正在努力防止AI代理滥用权限或泄露数据。

Apollo-1采用了一种叫“神经符号推理”的技术,结合了传统AI的逻辑推理能力和大语言模型的处理能力。这种方式让AI在执行任务时更加可靠。

AUI的CEO Elhelo表示,虽然大语言模型适合生成对话内容,但它们的行为难以预测,这使得在实际应用中难以保证准确性和稳定性。而神经符号推理可以让AI按照设定规则进行判断,这对企业来说更有吸引力。

神经符号方法近年来受到关注,一些开发者尝试用它提高系统的可靠性,以便向金融和政府等行业提供服务。不过,也有专家对这种方法持保留态度,认为它和深度学习不太兼容。

根据一项测试,Apollo-1在处理现实任务方面比Claude 4等其他AI代理表现更好。测试包括修改航班预订、查询新航班等操作。AUI称Apollo-1的成功率超过90%,而Claude只有60%。

Apollo-1还在其他任务中表现出色,比如通过Google Flights订票,或者用Rufus聊天机器人在亚马逊上购物。

Elhelo希望这项技术能吸引银行、航空公司、保险公司和零售商等需要高可靠性的企业。Apollo-1会逐步展示它的思考过程,让开发者和运营人员了解其行为逻辑,并设置规则,比如在退款前检查公司政策。

AUI还与Google Cloud达成合作,允许他们的客户使用Apollo-1来驱动自己的聊天机器人和智能代理。Elhelo表示,未来还可以扩展到语音模式等更多应用场景。

他说:“它可以提供清晰的可见性,让公司真正信任它。”

本文来源: 互联网 文章作者: 陈帝
    下一篇

导读:9月26日,财闻获悉,滴滴已开启公测AI出行助手“小滴Beta v0.8版本”,该功能在滴滴派单系统上,通过智能理解用户需求,为用户提供定制化的用车方案。叫哪辆车,由用户定。用户将滴滴App升级