11月29日,智谱AI首席执行官张鹏透露,他们的智能系统AutoGLM进行了重要升级。升级后的系统可以连续执行超过54个步骤的操作,并且能在不同应用间高效协同完成任务。现场展示环节,张鹏演示了通过AutoGLM发送2万元微信红包和1万元支付宝口令红包的过程。
AutoGLM最早在今年10月发布,能够完成点赞评论、购买历史商品、预订酒店以及购买火车票等多种任务。这次更新不仅发布了新版AutoGLM,还推出了面向PC端的智能体GLM-PC,应用场景涵盖会议记录、文档整理、网络搜索与总结、远程指令操作以及隐藏界面控制等。
2024年初,随着ChatGPT的兴起,很多企业开始寻找大模型领域的突破性应用。到了年底,智能体逐渐成为更重要的研究方向。苹果、Anthropic、谷歌和OpenAI等公司都把智能体定为2025年的重点研究领域。Gartner预计,到2028年,至少15%的工作决策将由智能体自动完成,而2024年这个数字几乎为零。
针对此趋势,张鹏在接受媒体采访时提到,业内对大模型超级应用的期待可能有些过高。他指出,大模型是高投入的技术项目,需要长时间的努力。智谱AI更关注智能体的基础研发,而不是单一性能的提升。另外,由于人们日常面对的任务通常是复杂的多维度交互,智能体必须拥有全面的能力才能达到理想效果。
市面上已有多款智能体产品,例如字节跳动的扣子、钉钉的AI助手、夸克AI写作助手CueMe以及百度的百小应等。凭借多年累积的资源,互联网巨头更容易与其他行业伙伴形成资源互补的合作关系。谈及创业公司与大企业的竞争,张鹏表示,智谱AI更重视技术驱动和明确的目标导向,不会局限于短期收益。在生态构建方面,智谱AI采取开放策略,欢迎合作伙伴利用其开放技术平台开发自有应用并挖掘商业潜力。
从技术角度分析,智谱AutoGLM的技术负责人刘潇介绍称,AutoGLM实际上是一种基于用户界面交互的智能系统,它通过模拟人类行为完成任务,而非采用传统机械调用方式。
张鹏补充说,AutoGLM在人与应用之间搭建了一层执行调度平台,极大改变了人机互动模式。展望未来,智谱AI认为LLM-OS(大型语言模型操作系统)具有广阔前景,基于大模型的智能特性,有望带来更自然的人机交互体验。
LLM-OS是一种依托深度学习技术打造的创新操作系统,它以大型语言模型为核心模块,旨在赋予操作系统层面的智能化功能。
在大模型时代操作系统布局上,张鹏表示,智谱AI正通过与现有操作系统厂商合作的方式开拓市场,将AI能力整合进其中,推动原生大模型的新操作方式。目前,相关研究工作正在进行中。