多基因风险评分(polygenic risk scores,PRS)是目前具有较大应用前景的预测疾病风险的方法,其相关领域的发展一直受到广泛的关注。然而目前的算法存在固有偏差,可能会影响在跨种族人群中的预测效果。由于目前的全基因组关联分析(genome-wide association studies,GWAS)大部分在欧洲裔人群中开展,PRS在其他非欧洲裔人群中的应用有所局限,降低了其潜在临床应用价值。近年来的一些研究聚焦评估遗传学研究中的种族不平衡,扩大了非欧洲裔人群GWAS规模,为PRS的跨种族研究及应用提供了可能。但PRS分析方法的准确性一直是限制其发展的重要因素。
2022年5月5日,由哈佛大学及Broad研究所葛天团队、黄海亮团队以及上海交通大学Bio-X研究院秦胜营团队联合在Nature Genetics在线发表了题为Improving polygenic prediction in ancestrallly diverse populations的研究论文,建立了一种新的多基因风险评分算法能够更准确地预测不同人群的疾病风险。
基因变异可能会增加某些疾病风险,其中一些基因变异与某些特定疾病风险密切相关,如BRCA1基因变异与乳腺癌。不过,大多数常见疾病如II型糖尿病、高血压及抑郁症,并不是受单个基因的影响,而是受整个基因组中成百上千个基因变异的影响,其中每种变异具有较小的影响。PRS可综合评估整个基因组的遗传变异的影响,具有预测疾病风险的潜力,将来可帮助医师推荐预防性措施并更好地监测患者,以便进行疾病早期诊断和干预。
然而,PRS首先需要收集大量人群遗传数据进行训练,尽管在不同种族人群中有许多共同的致病变异,但在疾病的遗传基础方面仍然存在一些不可忽视的重要差异。比如在某个人群中与特定疾病相关的常见基因变异,在另一个人群中可能发生频率很低甚至不存在。即便一种疾病相关的基因变异在不同种族人群中都存在,它在多大程度上影响疾病风险仍然具有较大的种族差异。因此,将基于某一人群遗传数据训练得到的PRS应用于其他人群中时其效果会减弱。
现有PRS算法的主要问题是大部分遗传研究都基于欧洲裔人群,使其在非欧洲裔人群中应用时将产生偏差,可能导致高估或低估相应疾病风险。幸运的是,基于其他人群的遗传研究日益增长,通过整合这些资源,本研究建立了一种新的PRS预测方法PRS-CSx,该方法基于整合多种族人群的遗传数据,可解释其相似性和差异性。尽管所使用的训练数据中大部分来自欧洲裔人群,研究人员开发算法尽最大可能发挥了非欧洲裔人群数据的效能并最终大幅度提高了对不同种族个体的预测准确性。
本研究通过所建立的PRS-CSx方法利用多个不同人群的遗传信息预测了大量表型相关指标,如身高、BMI和血压,血液生化指标如葡萄糖和胆固醇,以及精神分裂症患病风险。与现有的PRS方法相比,PRS-CSx在非欧洲裔人群中的预测准确率具有显著提升。为了进一步提高不同群体的PRS预测准确度,未来仍需进一步扩大全球群体样本的多样性,特别是非欧洲裔人群基因组数据集的扩展,基于此研究人员将对PRS-CSx进一步优化,希望有一天能协助临床医生指导疾病预防与治疗。同时PRS-CSx也可在探索基因-环境相互作用等基础研究中发挥重大作用。
“随着我国对复杂性疾病遗传学基础研究的持续投入,我国各类疾病遗传数据将不断增长,”上海交通大学Bio-X研究院贺林院士指出:“这将不断加强PRS-CSx对中国人群等非欧洲裔人群复杂性疾病疾病风险的预测效果,未来结合临床遗传咨询,多基因风险评分方法有望协助医生进行疾病的预测与预防。”
该论文通讯作者为哈佛大学及Broad研究所葛天教授、黄海亮教授以及上海交通大学Bio-X研究院秦胜营研究员,论文第一作者是上海交通大学Bio-X研究院及Broad研究所联合培养博士后阮云凤博士。哈佛-MIT Broad研究所国际精神疾病遗传学研究联盟成员及神州医疗科技股份有限公司为本研究提供了大力支持。
上海交通大学Bio-X研究院秦胜营团队长期从事药物基因组学与个体化医学、出生缺陷与疾病基因组学等方面的研究。诚邀各位青年才俊加盟课题组从事博士后研究。有意向者请将详细个人简历发送电子邮件到email:hrofpmcq@163.com、chinsir@163.com ;联系电话:张老师,021-62932779-8202;哈佛大学/Broad研究所黄海亮教授团队和葛天教授团队长期招聘具有统计遗传学、基因组学、计算生物学等相关背景的博士后,欢迎有意向优秀青年才俊将详细个人简历发送电子邮件到hhuang@broadinstitute.org(申请黄海亮教授团队)或者tge@broadinstitute.org(申请葛天教授团队)。
论文链接:
https://www.nature.com/articles/s41588-022-01054-7