机器学习赋能肾脏病学研究:荷兰学者Tamas Szili-Torok的创新探索与中国实践愿景
发表时间:2025-08-19 14:51:51
编者按:在第62届欧洲肾脏协会年会上,荷兰格罗宁根大学医学中心博士后研究员Tamas Szili-Torok博士分享了其在新兴交叉学科——临床数据科学领域的前沿探索。作为医学与数据科学交叉学科的研究者,他聚焦机器学习与人工智能在肾脏病学中的应用,尤其致力于通过机器学习算法预测慢性肾病患者的临床结局。肾医线记者邀请Tamas Szili-Torok博士就此话题进行了深度分享。
跨学科研究:从临床数据到智能预测模型
“我们采用了一种极具创新性的机器学习算法,它在临床适用性方面潜力巨大。”Szili-Torok博士介绍道,鉴于其对技术与医学相结合的浓厚兴趣,在所在科室导师的支持下,他们成立了一个新的临床数据科学研究小组,旨在采用更现代的方法(如机器学习等),对格罗宁根医学中心普通人群研究和肾脏移植受者的海量数据,来预测肾脏病相关的患者结局。例如,其团队利用该技术对肾脏移植受者的术后糖尿病风险、移植物衰竭等结局进行预测,同时结合代谢组学、蛋白质组学等高维度数据,挖掘与疾病结局相关的生物标志物,为未来的靶向治疗提供理论基础。因此,他们的研究兴趣主要集中于“预测”,并深度利用代谢组学等高维度数据集来解释病理生理学机制。
值得关注的是,他与学生共同开发了针对医学需求的特征选择新方法,这种机器学习方法不仅包括医学中常见的生存分析,还加入了共线性检验,从而解决了传统机器学习在医学数据应用中的局限性。
方法论革新:机器学习与传统数据分析的范式差异
处理组学数据时,通常会多次进行单变量分析,然后进行多重检验校正。谈及机器学习与传统关联分析的区别,Szili-Torok以“足球队协作”作比喻:“单个球员(特征)表现优异,但组合后可能因互动不佳而失效;反之,个体表现普通的球员组合可能产生强大合力。”特征组合也可能如此。因此,在特征选择过程中考虑这些复杂的交互作用,我们实际上能选出更好的特征。而机器学习的优势在于能捕捉特征间的复杂交互作用。
建模方面,传统方法通常假设线性关联。而在医学或生物领域,我们研究的很多关联并非线性。机器学习模型则可以自动考虑这种非线性关系,真正对这些非线性关联进行建模,即无需预设线性关联假设,可自动拟合U型、指数型等非线性关系。传统方法虽然也可以通过多次尝试实现建模,但存在过拟合的风险。
跨学科人才:破解临床机器学习落地难题的关键枢纽
对许多临床医生来说,使用这些机器学习模型非常困难,这正是临床数据科学的主要价值所在。对于临床医生关心的“技术落地”问题,Szili-Torok博士强调了跨学科背景的重要性。医学博士有医学背景,如果兼具数据科学知识,则既能提出有临床价值的问题,又能搭建适用于医疗场景的模型,这是推动领域发展的关键。当然,我们不能指望临床医生成为数据科学或应用数学专家,因而他认为,拥有医学背景并接受过数据科学培训的人才,是为该领域做出贡献的关键。其自身经历颇具代表性——新冠疫情期间自学编程,将技术与医学研究深度融合,开创了肾脏病学研究的新路径。
未来展望:临床数据科学的专业化与中国机遇
“我认为未来应设立一个新的医学专科——‘临床数据科学’,以推动数据科学与医学的系统性融合。”Szili-Torok博士展望道,随着医学数据爆炸式增长,机器学习将在两大方向凸显价值:一是基于大规模人群研究实现个体化医疗预测,二是通过数据驱动加速靶向药物研发,改变传统“偶然发现”的药物开发模式。
值得关注的是,他近期申请了“国家自然科学基金海外优秀青年科学基金项目”,计划在中国进一步拓展机器学习在个体化医疗中的应用。“中国具备基础设施、高质量数据和人才储备三大优势,必将成为临床数据科学领域的重要力量。”他指出,中国在该领域的战略投入与创新生态,为跨学科研究提供了理想土壤,而他期待在这一进程中贡献力量,推动机器学习在肾脏病学乃至整个医学领域的深度落地。