万亿级token病例炼就首个医疗增强模型，Baichuan-M1-14B开源！

wisemodel开源社区

2025-03-04 18:30始智AI wisemodel官方账号

+关注

AI划重点 · 全文约1253字，阅读需4分钟

1.百川智能成功开源首个医疗增强模型Baichuan-M1-14B，旨在解决AI医疗技术决策过程不透明、可及性差异大等问题。

2.该模型在医疗数据处理、疾病诊断预测、医疗影像分析等方面表现出色，已上线始智AI-wisemodel开源社区。

3.为此，百川智能进行了大量优化和创新工作，包括收集万亿级token的严肃医疗数据、生成超100B token的多样化数据等。

4.同时，模型训练阶段采用了多阶段领域提升方案和ELO强化学习法，有效提升了生成质量和逻辑推理能力。

5.Baichuan-M1-14B开源模型将为我国AI医疗健康生态建设提供强大助力。

以上内容由腾讯混元大模型生成，仅供参考

始智AI wisemodel.cn开源社区

在医疗领域，AI技术发展迅速，带来变革的同时也面临挑战：AI医疗技术决策过程不透明，让人担忧其可靠性；医疗服务在不同地区、人群间可及性差异大；AI医疗生态也需更多创新来拓展应用。

为解决这些问题，百川智能专注AI医疗创新。经长时间研发，成功开源Baichuan-M1-14B模型。该模型融合前沿技术，优化算法与结构，在医疗数据处理、疾病诊断预测、医疗影像分析等方面性能出色。目前，Baichuan-M1-14B已上线始智始智AI-wisemodel开源社区。欢迎大家前往体验。

模型地址

https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Base

https://wisemodel.cn/models/Baichuan-inc/Baichuan-M1-14B-Instruct

01.

性能惊艳，实力领航

在AI技术迅猛发展并深度融入各行业的当下，医疗领域对AI技术的应用需求与日俱增。在此背景下，百川智能推出的Baichuan-M1-14B模型横空出世，作为行业首个医疗增强开源模型，承载着推动AI医疗变革的重任。

Baichuan-M1-14B模型展现出卓越性能。在cmexam权威医学知识评测中，它精准回答各类医学概念、病理机制、药物特性等问题，得分远超更大参数量的Qwen2.5-72B-Instruct。

在clinicalbench_hos针对临床实际病例分析的评测里，无论是复杂病情的诊断思路，还是治疗方案的给出，Baichuan-M1-14B都展现出强大的实力，成绩同样超过Qwen2.5-72B-Instruct。

在erke关于临床能力综合考察的评测中，涵盖从问诊技巧到治疗决策等多环节，Baichuan-M1-14B依然表现出色，成绩与行业内备受认可的o1-mini模型不相上下，彰显其在医疗领域的深厚潜力和强大实力。

02.

多管齐下，优化创新

为了提升Baichuan-M1-14B的医疗能力，我们多管齐下做了大量的优化、创新工作。

数据收集方面：面向细分医疗场景，收集了万亿级 token 的严肃医疗数据，涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例，亿级的医疗问答、医疗问诊、临床数据等，还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估，确保模型能学习到有价值且全面的医疗知识。

合成数据方面：针对病例、医学教材、医学指南等不同类别的高质量医疗数据，生成了超100B token包含了医疗复杂决策推理链条、决策依据以及问答对形式的多样化数据，进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

模型训练阶段：我们运用行业首创的多阶段领域提升方案，将整个训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三阶段，依次提升基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO 强化学习法，优化思维链路径，避免传统奖励模型偏差，有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是我们在AI医疗领域的又一次重要突破，让我们在实现“造医生、改路径、促医学”愿景的道路上又迈出了坚实的一步。而Baichuan-M1-14B开源模型也将为中国AI医疗健康生态建设提供强大助力。

编辑丨赵雅鑫

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。