值得买科技CTO王云峰:1.2亿优质训练语料 找到最优数据配比

图灵汇官网

【科技环球网报道 记者 张明宇】2月29日,值得买科技自主研发的人工智能购物助手“小值”正式在“什么值得买”App上架。这款基于值得买消费大模型打造的AI产品,具备深度对话理解用户需求的能力,能够整合全网实时消费信息与价格数据,迅速汇总口碑、商品对比、推荐和全网比价等功能,旨在为面临多种决策挑战的消费者提供个性化建议,从而显著提升消费决策的质量和效率。

上线一周内,值得买科技收到了众多消费者的反馈。在整体的购物过程中,“小值”能够帮助用户快速实现全网比价、产品介绍和推荐,然而,新产品也面临准确性、个性化功能提升等挑战。

作为项目负责人,值得买科技的首席技术官王云峰对此表示理解。他表示,在“小值”上线前,团队已进行了全面的内部测试,以优化功能和用户体验。约有1%的用户愿意分享更真实的使用体验反馈,特别是在个性化需求和结果推荐方面,这是消费者最为关注的体验点。

王云峰表示,他们对此感到欣慰。在消费行业中,AI大模型的个性化推荐需要高度精确的数据训练,以洞察消费者的消费偏好,进而提供更精准的消费决策建议。这对行业而言,是未来发展的关键趋势。

事实上,AI大模型在电商领域的应用虽未能直接重塑行业的底层商业模式,却极大地缩短了消费者的决策路径,使得用户能够在较短时间内完成购物体验。

在模型构建方面,值得买科技从海量网络数据中筛选出1.2亿条与消费相关的高质量训练素材,基于数万轮对话数据,训练了整个模型的意图理解与交互能力。他们通过构建12个针对消费领域的场景工具,实现了意图分解与任务生成,满足了用户的特定需求。同时,他们引入了动态信息来源,运用向量化技术,通过语义检索,确保与用户问题相关的内容得到充分展示,强化了消费领域的检索增强。

这样的大模型训练覆盖了全网跨平台近70亿条消费信息,每日新增信息量高达2000万条。1.2亿条消费相关优质训练素材不仅体现了数据量的巨大,更体现了其质量和在数据库中的最佳配置,数据质量正在持续提升和迭代。

王云峰强调,数据积累是大模型的核心竞争力之一。在智能消费决策方面,个性化推荐和多模态识别被视为未来的发展方向。通过“评、挑、荐、省”四大服务,基于用户行为、兴趣偏好等大数据,AI模型提供了个性化的商品推荐,同时快速准确地解答问题和提供选购建议,旨在帮助用户更好地进行消费决策。

“小值”自上线以来,用户的使用体验如何?根据值得买科技收到的反馈,在流程上,用户体验流畅。但在具体需求实现上,“小值”仍有提升空间。这需要不断更新语料和模型训练,考虑到消费行业的特性,如商品价格、品质、消费者偏好等因素的变化,如何为用户提供精准推荐,并根据消费者的敏感决策因素进行详细说明,是大模型需要改进的方向。

在图片、视频等多媒体支持阶段,如何利用多媒体信息进行商品识别,形成完整的消费推荐链,还需要技术的持续优化。

未来,“小值”将在三个方向持续优化升级:深化用户画像与对话层次,深入理解用户意图;集成图片等多模态识别,提升用户体验;优化内容库中的优质消费内容,提高小值建议或推荐的质量。

王云峰认为,“小值”更像是一个结合感知、分析、推荐和执行能力的AI购物助手,专注于解决不同消费者个性化的决策难题,与消费者的沟通更为顺畅,甚至在无需过多输入的情况下,就能提供消费决策推荐和行程规划。

在电商领域,值得买科技自2023年起将人工智能纳入年度重点战略,组建了AI实验室,并建立了与业内顶尖大模型公司、云计算公司以及各大高校实验室的合作关系,从人才、算力、模型等多个层面推动人工智能的深入研究。王云峰坚信,人工智能技术与行业的深度融合将大幅提升行业生产力,使生产效率从低效转变为高效,释放更多创造力。

2024年,值得买科技在AI技术上的投入预计将翻番,旨在更好地为消费者推荐商品,并深入挖掘消费者的内在消费情感需求。大模型的能力提升将是行业共同面对的关键问题,行业内的大模型迭代与合作也将成为未来趋势。

王云峰透露,除了“小值”,值得买科技还将考虑将相关AI能力开放给B端品牌及平台,助力行业伙伴充分利用AI技术,把握行业发展机遇。

本文来源: 图灵汇 文章作者: 海景铭
    下一篇

【环球网科技综合报道】据外媒报道,近日,人工智能领域的领军企业OpenAI针对马斯克提起的诉讼做出了回应。根据公司内部备忘录,OpenAI表示“断然不同意”马斯克对该公司的指控。此前,马斯克向旧金山高