1.百川智能成功开源首个医疗增强模型Baichuan-M1-14B,旨在解决AI医疗技术决策过程不透明、可及性差异大等问题。
2.该模型在医疗数据处理、疾病诊断预测、医疗影像分析等方面表现出色,已上线始智AI-wisemodel开源社区。
3.为此,百川智能进行了大量优化和创新工作,包括收集万亿级token的严肃医疗数据、生成超100B token的多样化数据等。
4.同时,模型训练阶段采用了多阶段领域提升方案和ELO强化学习法,有效提升了生成质量和逻辑推理能力。
5.Baichuan-M1-14B开源模型将为我国AI医疗健康生态建设提供强大助力。
以上内容由腾讯混元大模型生成,仅供参考
始智AI wisemodel.cn开源社区
在AI技术迅猛发展并深度融入各行业的当下,医疗领域对AI技术的应用需求与日俱增。在此背景下,百川智能推出的Baichuan-M1-14B模型横空出世,作为行业首个医疗增强开源模型,承载着推动AI医疗变革的重任。
为了提升Baichuan-M1-14B的医疗能力,我们多管齐下做了大量的优化、创新工作。
数据收集方面:面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。
模型训练阶段:我们运用行业首创的多阶段领域提升方案,将整个训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三阶段,依次提升基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO 强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。
Baichuan-M1-preview是我们在AI医疗领域的又一次重要突破,让我们在实现“造医生、改路径、促医学”愿景的道路上又迈出了坚实的一步。而Baichuan-M1-14B开源模型也将为中国AI医疗健康生态建设提供强大助力。