百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

投稿
APP
微信扫一扫获取更多

百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

钟玲莉

2024-01-29 00:00:00

图灵汇官网

百川智能发布千兆级参数大语言模型Baichuan 3，展现多项卓越突破

亮点概览： - 多维度能力跃升：Baichuan 3在通用能力评估、数学与代码专项评测中表现出色，特别是在中文任务上超越了GPT-4。 - 医疗领域优化：针对医疗场景进行深度优化，Baichuan 3在逻辑推理与专业性要求极高的评测中超越GPT-4，成为中文医疗领域最佳大模型。 - 诗词创作革新：突破“迭代式强化学习”技术，Baichuan 3在诗词创作格式、韵律与表意上显著提升，文采超越GPT-4。

详细突破：

多元化能力评估中的杰出表现

通用能力评测：Baichuan 3在CMMLU、GAOKAO和AGI-Eval等权威评测中表现出色，特别是在中文任务上超越了GPT-4。
专项评测：在MATH、HumanEval和MBPP等数学与代码专项评测中，Baichuan 3同样表现出卓越能力。

医疗领域专业优化

医疗知识整合：构建超千亿Token的医疗数据集，涵盖医学文献、电子病历、专业书籍及问答资料，确保模型在医疗领域的专业度与深度。
精准推理与提升：通过系统性的Prompt研究与调优，Baichuan 3在医疗任务中的表现显著提升，各类中英文医疗测试成绩较GPT-4提升2至14个百分点。

创作能力的飞跃

迭代式强化学习：结合RLHF与RLAIF，以及迭代式强化学习方法，Baichuan 3的语义理解和生成能力大幅提升，诗词创作能力达到全新高度，文采远超GPT-4。

免责声明：本网站内容由原创、合作伙伴供稿和第三方自媒体作者投稿构成，信息仅供参考。我们将努力确保信息的准确性，但对于任何可能引起的错误、不实或遗漏，概不承担法律责任。若认为本网站内容涉嫌侵犯知识产权或存在不实内容，请及时联系我们提出权利通知或不实情况说明，并提供相关证明材料。我们会依法核实并采取相应措施。