近日,首届中国大模型大会(CLM 2024)在北京举行,本次大会由中国中文信息学会大模型专家委员会发起,中国中文信息学会主办,十二个与大模型技术密切相关的学会专业委员会共同协办。大会以 “中国大模型之路”为主题,现场参会人数近千人。
医渡科技CTO、首席人工智能科学家闫峻博士作为医疗大模型实践代表出席“大模型+医疗健康”专题论坛,发表了“医疗垂直领域大模型的建设与应用”主题演讲,并与上海人工智能实验室智慧医疗中心主任及领军科学家张少霆教授、阿里巴巴达摩院医疗AI实验室算法专家姚佳文博士、北京协和医院神经外科冯铭教授就医疗大模型的落地挑战与未来探索展开深入探讨。
1、医疗大模型是多任务引擎
闫峻博士指出,“AI医疗要实现长久、可持续发展,就要形成‘数据与知识-模型-应用-产业’的闭环生态。大模型时代到来之前,人工智能技术的演进已经经历了知识工程时代、传统统计机器学习时代以及深度学习时代,但在医疗领域均未形成产业闭环。”
具体来看,知识工程时代的专家系统技术基于符号逻辑推理的方法,存在构建成本高、泛化能力弱的问题。这一时期的代表性AI医疗产品CDSS没有得到广泛应用,正是因为每个患者都有其独特的病史和并发症,预设的知识和推理能力无法覆盖所有真实病例,导致其在临床实践中的应用受到限制。
传统统计机器学习时代,基于统计学习技术的疾病预测模型等在学术研究中取得了一些成果,但真正应用于临床的情况并不多。原因在于早期的机器学习技术过度依赖于模型假设,学习能力不足,而在实际应用中,许多模型假设无法预知或不成立,导致该技术在商业化方面的模型效果和泛化能力不足。
深度学习时代则是在形成商业生态上遇到了瓶颈。因为深度学习模型的训练需要大量的数据和算力,并且通常只能解决单一任务,商业化收益十分有限。
“与之前的技术不同,大模型是一个多任务引擎,可以同时解决多个任务,这使其在处理复杂多样的临床情况时具有更大的潜力。通过预训练模型,大模型可以学习到广泛的知识和能力,从而更好地适应不同的应用场景。”闫峻博士表示。
2、数据、算力、算法、场景有效发力
要释放医疗大模型作为多任务引擎的潜力,还需要从数据、算力、算法、场景入手解决医疗大模型落地面临的挑战,并确保其在应用实践中的安全性、专业性和自主性。
数据方面,医疗大模型对高质量医疗数据的依赖性极高。然而,医疗数据往往分散存储,存在严重的信息孤岛问题。此外,医疗数据的表达方式不统一,数据质量也参差不齐。医渡科技在AI医疗领域深耕十年,经授权处理分析了40多亿份医疗记录(截至2023年9月30日),沉淀下来大量多维度可量化知识图谱,医渡科技基于自研的数据生成技术,将这些沉淀的知识图谱应用于大模型训练,为模型提供了丰富的医疗知识和经验。
算力的可及性是医疗大模型面临的另一个挑战。医渡科技的大模型是首家实现国内外主流芯片训练和推理全链路适配的模型。此外,医渡科技还提供了开箱即用的低成本一体机解决方案,使得医疗大模型能够更广泛地应用于各种医疗机构和场景,而不受限于高昂的算力成本。
医疗领域对算法的专业精准性、知识更新速度和安全伦理要求也非常高。除了将知识图谱应用于大模型训练外,医渡科技还通过真实世界数据的持续反馈和解释溯源体系的构建,实现医疗大模型的算法优化。目前,医渡科技大模型已通过国家网信办算法备案,并且于今年5月登顶了MedBench评测榜单榜首,在医学知识问答、医学语言理解、医疗安全和伦理三大关键维度中都拔得头筹,充分展现了其在专业性、理解力、逻辑性和安全性等方面的医疗专业实力。
在应用场景方面,医疗应用场景模糊分散,AI缺乏对医疗场景的深度理解。医渡科技已经形成了覆盖“医、药、险、患者”的商业闭环,深入理解行业需求和用户痛点,并将其转化为具体的应用需求,从而开发出能够真正解决行业问题的医疗大模型。
3、让大模型在更多场景可用
在闫峻博士看来,大模型在医疗领域不缺场景,然而要实现在每个场景中的可用性并不容易,这需要深入理解场景的本质。
以健康咨询为例,当儿童发热问题发生在呼吸道疾病高发期间,甲流、乙流、肺炎支原体感染和新冠等多种疾病可能同时传播。然而,这些疾病的检测方法、治疗方案和病程进展存在显著差异。大模型需要在家长焦虑的情境下辅助他们做出正确的决策:比如哪些体征可能是危急重症的提示,需要立即前往医院;哪些体征不需要家长太焦虑,如何在家采用哪些举措能达到更好的照护效果?同时也随时回答发热全流程的所有问题,比如如果三甲医院人满为患且存在交叉感染的风险,是否可以选择社区医院进行初步检查和诊断;如何进行适当的家庭护理?解决这些问题需要综合考虑医学知识、临床指南以及患者需求等因素。
基于医渡科技大模型研发的私人健康顾问——“开心健康科技”小程序,特别针对这一问题推出了儿童发热顾问功能。通过深入学习儿童发热的专业知识,该功能可以根据孩子的年龄和具体症状,帮助家长做出更科学的健康决策。此外,它还为家长提供了一站式就医指导、购药建议和居家自检选项等实用信息。
除儿童发热咨询外,“开心健康科技”利用先进的生成式AI技术和多模态理解能力,还可以为用户提供个性化的健康问答、导诊咨询、报告结果解读等专业服务。目前,“开心健康科技”还与公司“惠民保”业务深度结合,面向500多万“江苏医惠保1号”用户提供健康档案、健康随访等专享服务。
医疗机构的医、教、研、管等领域也都是大模型的落地场景。闫峻博士认为,医疗机构需要一个整体解决方案,让最懂需求场景的人拥有自主构建大模型应用的能力。
为了满足这一需求,医渡科技与昇腾AI合作推出了首个软硬件一体化的大模型训推一体解决方案,为用户提供了从大模型训练到推理、评测和应用的完整工具链,实现了客户专有大模型应用的标准化和流程化。这意味着每家医疗机构和每个医疗行业从业者都能够在自主创新的平台上,更方便、更自主、更安全地进行大模型的私有化部署,从而大大降低了大模型的研发和使用成本。
为了进一步发挥大模型的多任务引擎价值,医渡科技还将原有的医疗数据中台与大模型赋能的医疗AI中台相结合,形成医院数据智能双中台底座,赋予医院自主创新能力。“利用大模型技术提高数据生产和处理的效率,让经过治理的数据在业务场景上发挥作用,同时也变成大模型的训练语料,这样形成一个良性循环的飞轮,既提高数据的可用性,也提升智能技术的应用性,促进智慧服务、智慧临床、科研进步和管理效率的全面提升。”
医院AI中台作为智慧医疗的核心驱动力,其战略价值在于全面赋能医疗体系,引领行业向更高层次的智能化、数字孪生转型升级。通过深度融合人工智能技术与医疗实践,不仅深刻重塑了诊疗模式,极大提升了医疗效率与服务质量,更是为科研创新、资源优化、成本控制、患者体验、医院和医院集团提供知识共荣生态的构建带来了范式进步。
闫峻博士坚信,医疗大模型在医、药、险、患者各个领域都具备落地应用的潜力,目前医疗大模型作为生产力和效率工具的作用已经得到充分证明。通过不断创新与探索,相信医疗大模型能为医学领域开辟更为广阔的前景。
(正文已结束)