经过半年的准备,美团的大模型产品正式亮相。9月1日,美团发布了名为LongCat-Flash-Chat(中文名“龙猫”,简称“LongCat”)的大模型,同时在全球最大的开源代码托管平台Github和人工智能开源社区Hugging Face开放源代码,并同步上线官方网站。
美团方面表示,通过算法和工程设计的结合,LongCat-Flash在理论成本和处理速度上,相比行业内同等规模甚至更小的模型都有明显优势。经过系统优化,它在H800设备上实现了每秒100 token(大模型处理文本的最小单位)的生成速度,同时保持低成本,每百万token输出成本仅5元。
今年第一季度,美团CEO王兴在财报电话会议中提到,美团基础大模型能力已接近GPT-4o(一款多模态大模型)水平。如今随着这款大模型的发布和开源,美团也加入了字节豆包、腾讯元宝、阿里通义千问等互联网公司的行列,开始在AI原生应用领域发力。
一家头部大模型企业的技术人员体验后表示,LongCat主要突出智能体(Agent)和通用性(General)性能,属于短模型而非当前流行的长思考类型,可能对应美团需要的模型上下文协议服务(MCP服务)和客服场景。知名经济学者、工信部信息通信经济专家委员会委员盘和林则认为,现在几乎所有互联网公司都进入了AI大模型赛道,美团这次入局,更多考虑的可能不是增加新业务,而是防止竞争对手用AI改变整个行业格局。
记者实测发现,LongCat采用混合专家模型(Mixture-of-Experts, MoE)架构,总参数5600亿,激活参数在186亿到313亿之间(平均270亿),兼顾了计算效率和性能。设计上注重推理效率,推理速度更快,适合耗时较长的复杂智能体应用。测试中,记者让DeepSeek、字节豆包和LongCat分别生成150字的中秋短视频文案,未指定场景时,LongCat会加入“美团,让思念比月光先到”这样的品牌内容,而其他大模型生成的是通用文案,没有明显品牌信息。让LongCat生成母亲节策划案时,它提到“美团买菜,今天给妈妈做顿饭”,还建议添加互动二维码“领50元买菜券”。当仅要求“写一个营销策划”时,其他大模型通常虚拟品牌并给出通用建议,LongCat则聚焦“智慧生活,尽在美团”的城市主题,设计美团美食节、购物日、出行日等系列活动。这说明LongCat的特点是结合用户需求匹配美团业务的营销建议,尤其在节日等场景中直接关联自身产品,可能主要面向美团商户、内部人员或客服人员使用。此外,LongCat目前只有联网搜索生成功能,“深度思考”按钮显示灰色,点击后提示“敬请期待”。
一直以来,美团在AI领域的布局比较低调,相比其他互联网巨头较少公开进展。但今年以来,美团的AI动态不断,先后推出了AI编程工具NoCode、AI经营决策助手“袋鼠参谋”、针对酒店经营的垂类AI智能体“美团既白”等应用。3月的财报分析师电话会议上,王兴首次系统讲了美团的AI战略:“AI会改变所有行业,我们的策略是主动进攻而不是被动防守。”他当时提到,美团的AI部署分三个层面:AI在工作中的应用(AI at work)、AI在产品中的应用(AI in products),以及构建内部大语言模型(Building LLM)。这次LongCat的开源,正是“构建大语言模型”项目的首次公开。
除了自身业务,美团在AI和大模型领域的投资也很活跃。近两年,王兴多次表达对大模型的兴趣,曾尝试通过投资收购大模型创业公司光年之外来抢占先机,还投资了智谱、月之暗面等头部大模型企业。虽然相比其他大厂去年就推出大模型产品,美团这次发布稍晚,但坚持自主研发,可见大模型是美团必须重点布局的战略方向。
今年6月,美团核心本地商业CEO王莆中在零售服务大会上提到,美团每年在AI上投入超过百亿元,主要因为图形处理器(GPU)成本较高,但这样的投入是值得的。“只有持续投入AI基础设施和大模型研发,才能让美团过去十几年积累的各行各业大数据发挥新价值,否则这些数据无法被有效利用。”
互联网分析师尹生认为,美团的本地生活业务涉及物流、服务业等,这些领域劳动力密集、互动频繁,很适合用人工智能改造。对美团来说,不管是主动布局还是防御,大模型都是必须做的事情。盘和林也提到,上半年美团、阿里、京东都在进行外卖价格竞争,业务增长放缓,而阿里因为开发算力芯片和通义千问大模型的全球影响力,给资本市场带来了更多想象空间。“同样,美团发现现有业务增长空间有限,需要在新赛道寻找机会,AI大模型就是尝试方向之一。”他进一步分析,“比如点餐时如果用户不再看平台推荐,而是直接和AI大模型对话决定吃什么,没有自己的AI大模型,美团可能会在竞争中处于劣势。所以,美团更多考虑的不是增加新业务,而是防止对手用AI改变行业竞争格局。”