《新英格兰医学杂志》的副主编Elizabeth G. Phimister博士发表述评指出,为更好地评估遗传风险,有三件事必须完成:第一是确定关于等位基因的报告正确;第二是在基因测序与分析时,确定哪些基因变异有临床影响,也就是说哪些基因变异会直接导致患病风险;第三是确定哪些基因变异既有患病风险又可以人为干预。
如何找到有致病作用的基因变异呢?能不能简单地通过基因序列比对来辨别?不幸的是,答案是否定的。确定一个基因变异是不是有致病性,如果有致病性,致病风险有多大,这些问题都不是一句话可以概括的。
临床遗传学研究的一个目标是,确定所有的基因变异在不同种族不同疾病中的情况,另一个目标是确定每一个基因变异的致病风险在散发病例和家族性疾病患者中是不是一样高,在不同种族的人群中又如何。要实现这些目标,需要庞大的注释良好的数据集。
我们拥有快速增长的遗传和基因组信息,要实现以上目标在理论上应该是非常顺利的。然而事实上,我们还面临着非常多的挑战。一是在遗传学数据库中缺少元数据,比如缺少家族史记录;二是数据库中的信息可能存在错误,比如基因变异本来是良性却被标记为致病性;三是我们目前建立的数据库大部分都是独立存在的,各有一套分类系统,自成方圆,研究人员既无法一次查询多个数据库,也无法在数据库之间进行分析比较。
因此,我们需要建立一个标准来实现安全共享与人类健康息息相关的基因组数据和表型数据,使我们能够更高效地解释这些信息并造福人类。(作者:张星)
参考文献:New England Journal of Medicine 2015;372:2227-2228