导语:
《科创板日报》于9月11日发布报道(编者:宋子乔),揭示了Meta正全力推进一项创新项目——自主研发全新开源大型预训练模型。这一举措旨在提供免费商用服务,其性能将与GPT-4相匹敌,且参数量远超当前领先模型Llama2的数倍之多。预计该模型的训练工作将于2024年初启动。
据《华尔街日报》透露,为了支持这一雄心勃勃的计划,Meta不仅积极采购更多英伟达H100人工智能训练芯片,还在强化数据中心建设,以确保不再依赖微软的Azure云平台进行模型训练。这一转变标志着Meta在构建自研聊天机器人技术上的重要进展。
Meta的开源战略
在这场人工智能的竞争中,Meta以其“开源”策略树立了独特的品牌形象。这一策略允许用户免费利用其模型进行研究和商业应用,从而降低了个人开发者和中小企业进入门槛,加速了开源大模型生态的建设和成长。早在2月份,Meta通过开源Llama大模型重返生成式AI的核心领域,并在短短五个月内迅速推出了更新版本Llama2,其参数规模包括70亿、130亿和高达700亿的不同配置,其中700亿参数模型的性能已接近GPT-3.5。
扎克伯格坚信,“开源推动创新”,因为它为更多开发者提供了使用新技术的机会。他指出,开放的生态系统能促进更大的进步。Meta不仅在语言大模型MMS、计算机视觉模型SAM/I-JEPA、多模态AI模型ImageBind等领域开源了关键模型,还致力于通过自家模型为生态构建更开放的环境。
市场动态与挑战
然而,Meta在人工智能领域的探索并非一路坦途。6月初,一封质询信直接送达扎克伯格,对Llama模型泄露事件进行了严厉的问询。近期,公司遭遇了大模型团队内的动荡,人员流失严重,已有超过一半的初代Llama模型核心作者离职。同时,生成式AI领域的竞争日益激烈,不仅OpenAI持续推出GPT-3.5的优化版本,且有迹象表明,其即将推出GPT-5的商标申请工作已展开。此外,苹果、谷歌、微软和亚马逊等科技巨头也在加大投资,竞相开发先进的人工智能模型,力求在聊天机器人、生产力工具和智能家居等应用领域占据优势。
展望未来
尽管面临多重挑战,但Meta和整个科技行业在生成式人工智能领域的竞争依旧充满活力。随着各大公司持续投入资源,创新速度加快,这场年度大戏将持续吸引全球关注,带来更多令人期待的发展与突破。