Meta憋大招！明年初训练全新开源大模型对标GPT-4、正抢购更多H100芯片

投稿
APP
微信扫一扫获取更多

Meta憋大招！明年初训练全新开源大模型对标GPT-4、正抢购更多H100芯片

科技生活

2023-09-12 13:09:10

图灵汇官网

导语：

《科创板日报》于9月11日发布报道（编者：宋子乔），揭示了Meta正全力推进一项创新项目——自主研发全新开源大型预训练模型。这一举措旨在提供免费商用服务，其性能将与GPT-4相匹敌，且参数量远超当前领先模型Llama2的数倍之多。预计该模型的训练工作将于2024年初启动。

据《华尔街日报》透露，为了支持这一雄心勃勃的计划，Meta不仅积极采购更多英伟达H100人工智能训练芯片，还在强化数据中心建设，以确保不再依赖微软的Azure云平台进行模型训练。这一转变标志着Meta在构建自研聊天机器人技术上的重要进展。

Meta的开源战略

在这场人工智能的竞争中，Meta以其“开源”策略树立了独特的品牌形象。这一策略允许用户免费利用其模型进行研究和商业应用，从而降低了个人开发者和中小企业进入门槛，加速了开源大模型生态的建设和成长。早在2月份，Meta通过开源Llama大模型重返生成式AI的核心领域，并在短短五个月内迅速推出了更新版本Llama2，其参数规模包括70亿、130亿和高达700亿的不同配置，其中700亿参数模型的性能已接近GPT-3.5。

扎克伯格坚信，“开源推动创新”，因为它为更多开发者提供了使用新技术的机会。他指出，开放的生态系统能促进更大的进步。Meta不仅在语言大模型MMS、计算机视觉模型SAM/I-JEPA、多模态AI模型ImageBind等领域开源了关键模型，还致力于通过自家模型为生态构建更开放的环境。

市场动态与挑战

然而，Meta在人工智能领域的探索并非一路坦途。6月初，一封质询信直接送达扎克伯格，对Llama模型泄露事件进行了严厉的问询。近期，公司遭遇了大模型团队内的动荡，人员流失严重，已有超过一半的初代Llama模型核心作者离职。同时，生成式AI领域的竞争日益激烈，不仅OpenAI持续推出GPT-3.5的优化版本，且有迹象表明，其即将推出GPT-5的商标申请工作已展开。此外，苹果、谷歌、微软和亚马逊等科技巨头也在加大投资，竞相开发先进的人工智能模型，力求在聊天机器人、生产力工具和智能家居等应用领域占据优势。

展望未来

尽管面临多重挑战，但Meta和整个科技行业在生成式人工智能领域的竞争依旧充满活力。随着各大公司持续投入资源，创新速度加快，这场年度大戏将持续吸引全球关注，带来更多令人期待的发展与突破。