1月24日,百川智能推出了一款名为Baichuan-M1-preview的全场景深度学习模型。这款模型结合了语言、视觉和搜索三种领域的推理能力。同时,它具备医疗循证功能,能从医疗证据检索到深度推理全程覆盖,帮助快速解决临床和科研中的医疗难题。
目前,Baichuan-M1-preview已上线百小应平台。为推动AI医疗行业发展,百川智能发布了首个开源医疗增强大模型Baichuan-M1-14B。作为全场景深度学习模型,Baichuan-M1-preview在语言、视觉和搜索推理方面表现优异。
尤其值得一提的是,Baichuan-M1-preview在医疗循证模式上的功能尤为突出。在面对复杂医学问题时,它能依靠专业的医疗知识进行推理,协助用户制定医疗方案。为此,百川智能自主搭建了一个包含数十亿条目的循证医学数据库,收录了大量国内外权威医学资料,如指南、文献、专家共识、疾病分析及药品说明等,并每日更新,保证内容时效性。
通过“医疗循证模式”,Baichuan-M1-preview实现了从证据检索到深度推理的全流程操作,解决了医疗领域信息量大、不确定性和信息分散的问题。为促进AI医疗技术创新,提高透明度和信任度,同时扩大医疗服务范围,百川智能开源了Baichuan-M1-14B这一小规模版本模型。
为加强Baichuan-M1-14B的医疗能力,百川智能采取了一系列措施。在数据建设上,他们获取了万亿级别的专业医疗数据,包括千万级中英文医学论文、真实医院病例、医疗问答和临床数据,并对网络数据分类评估,确保模型学习到有价值的全面医疗知识。此外,他们还基于高质量医疗数据生成了超千亿token的数据集,涵盖医疗复杂决策链、决策依据及问答对等形式,既扩展了知识表达方式,又模仿了医生的思维逻辑,进一步提升了模型的医学知识和推理水平。
在模型训练期间,百川智能采用多阶段领域提升策略,把训练分成通用能力提升、医疗基础能力提升和高级医疗能力提升三个阶段,逐步增强模型的基础语言能力和应对复杂疾病的水平。另外,他们在CoT训练框架中引入了ELO强化学习方法,优化了思维链路径,降低了传统奖励模型的偏差,提升了模型的生成质量和逻辑推理能力。