Meta憋大招!明年初训练全新开源大模型 对标GPT-4、正抢购更多H100芯片

图灵汇官网

导语:

《科创板日报》于9月11日发布报道(编者:宋子乔),揭示了Meta正全力推进一项创新项目——自主研发全新开源大型预训练模型。这一举措旨在提供免费商用服务,其性能将与GPT-4相匹敌,且参数量远超当前领先模型Llama2的数倍之多。预计该模型的训练工作将于2024年初启动。

据《华尔街日报》透露,为了支持这一雄心勃勃的计划,Meta不仅积极采购更多英伟达H100人工智能训练芯片,还在强化数据中心建设,以确保不再依赖微软的Azure云平台进行模型训练。这一转变标志着Meta在构建自研聊天机器人技术上的重要进展。

Meta的开源战略

在这场人工智能的竞争中,Meta以其“开源”策略树立了独特的品牌形象。这一策略允许用户免费利用其模型进行研究和商业应用,从而降低了个人开发者和中小企业进入门槛,加速了开源大模型生态的建设和成长。早在2月份,Meta通过开源Llama大模型重返生成式AI的核心领域,并在短短五个月内迅速推出了更新版本Llama2,其参数规模包括70亿、130亿和高达700亿的不同配置,其中700亿参数模型的性能已接近GPT-3.5。

扎克伯格坚信,“开源推动创新”,因为它为更多开发者提供了使用新技术的机会。他指出,开放的生态系统能促进更大的进步。Meta不仅在语言大模型MMS、计算机视觉模型SAM/I-JEPA、多模态AI模型ImageBind等领域开源了关键模型,还致力于通过自家模型为生态构建更开放的环境。

市场动态与挑战

然而,Meta在人工智能领域的探索并非一路坦途。6月初,一封质询信直接送达扎克伯格,对Llama模型泄露事件进行了严厉的问询。近期,公司遭遇了大模型团队内的动荡,人员流失严重,已有超过一半的初代Llama模型核心作者离职。同时,生成式AI领域的竞争日益激烈,不仅OpenAI持续推出GPT-3.5的优化版本,且有迹象表明,其即将推出GPT-5的商标申请工作已展开。此外,苹果、谷歌、微软和亚马逊等科技巨头也在加大投资,竞相开发先进的人工智能模型,力求在聊天机器人、生产力工具和智能家居等应用领域占据优势。

展望未来

尽管面临多重挑战,但Meta和整个科技行业在生成式人工智能领域的竞争依旧充满活力。随着各大公司持续投入资源,创新速度加快,这场年度大戏将持续吸引全球关注,带来更多令人期待的发展与突破。

本文来源: 图灵汇 文章作者: 科技生活
    下一篇

能科科技9月15日披露投资者关系活动记录表显示,AI技术目前处于探索阶段,也计划与亚马逊合作共同探索,因为亚马逊在AI技术上已经拥有落地的应用场景,公司希望通过与亚马逊合作AI在自研产品上能够实现落地转换,实现工业软件+AI的发展目标。