基因相关的资料网站哪家强?
基因检测报告可以告诉我们,被检测对象哪些基因发生了哪些变异。报告通常会有一个段落详细解释该基因的功能和临床表现。
想自己动手查查,该上哪家网站?
基因检测解读秘籍系列
1
2
3
4
5
基因相关的资料网站哪家强?
6
看不懂变异的命名规则怎么办?
7
为什么有时要验证患者的父母?
8
为啥报告一定要写清楚转录本?
9
变异的人群频率有什么用?
10
致病等级是拿什么标准评的?
11
如何看待“临床意义未明”?
12
看了这么多报告,你关注过数据质量吗?
和遗传病有关的数据库有很多,侧重点均有不同,可以大致分为基因、位点、人群频率和用药四类。
OMIM
网址:https://omim.org/
侧重点:基因
OMIM是Online Mendelian Inheritance in Man的简称。OMIM是MIM的在线版,后者是一本由美国Johns Hopkins大学医学院Victor A McKusiek教授主编的《人类孟德尔遗传》(Mendelian Inheritance in Man:Catologs of Human Genes and Genetic Disorders,MIM)的书,一直是医学遗传学最权威的百科全书,被誉为医学遗传学界的圣经。
OMIM除了可直接输入基因查询,还可以输入疾病表型来搜索相关基因。该数据库有专人审核,并且有持续更新。
ClinGen
网址:https://www.clinicalgenome.org/
侧重点:基因、位点
2018年12月4日,美国食品与药物监督管理局FDA认可了由临床基因组资源(Clinical Genome Resource, 简称 ClinGen)专家联盟整理和审核的人类遗传数据中的遗传变异信息。这是FDA首次正式认可基因、遗传变异与疾病关系的公共数据库。
在网站首页banner中,列举了截止本文发稿时有1580个基因,10640个位点被33个专家小组审核通过了。通过点击1580这个数字,可以查询具体的基因。每个基因均列举了专家小组收录的证据和相关文献。可能由于审核过于严格的关系,很多基因都没有被收录。
点击10640个位点时,可进入到ClinVar数据库的界面,可以发现在搜索栏加上了("reviewed by expert panel"[Review status]) OR "practice guideline"[Review status] 这样的筛选条件。
ClinVar
网址:
https://www.ncbi.nlm.nih.gov/clinvar/
侧重点:位点
ClinVar 是一个公开免费数据库,收集了与疾病相关的变异,包括遗传性(germline)和获得性(somatic)的变异。这一数据库由美国国立卫生研究院(NIH)2013年构建,并以一个月一次的频率更新。该网站的数据可以通过ftp站点下载,用来整合到注释软件内。
想要寻找位点是否有过报道,可在搜索框内输入位点的基因组坐标,或者直接输入基因名称在页面中查找。
人群频率数据库概览
目前常用的几个人群数据库总样本量统计如下[1]:
1000G数据库主要由WGS数据组成,ESP和ExAC主要为WES数据,而gnomAD两者皆有。显然总样本量越大,位点在人群中的频率也就越精确(尤其是我们关心的东亚人群),一些罕见的变异也更有机会被测到。各数据库都有自己的网站可以供查询,当然也可以用注释软件来整合。
特别需要提到的是,华大基因根据第一期14万例NIPT测序数据,构建了中国人的人群数据库CMDB。目前开放位点查询,支持API的接入。另外,还有复旦大学的“华表”公共数据库项目正在进行中,我们期待它尽早可以开放使用。
网址:https://db.cngb.org/cmdb/
VEP:在线注释工具
常用的位点在线注释工具有wannovar,oncotator,VEP等。其中VEP的界面比较好看,毕竟颜值即正义。
从工具界面上来看,VEP是Ensembl旗下的一个在线注释工具。不会填写位点信息的话,可以点击example按钮,会给出一些示例,照着填就好了。几分钟的排队和运行以后,就可以看到结果中有各数据库和不同人群的位点频率信息了。
药物基因组数据库PharmGKB
网址:https://www.pharmgkb.org/
侧重:药物基因组
PharmGKB全称是Pharmacogenetics and Pharmacogenomics Knowledge Base,也就是遗传药理学与药物基因组学数据库。该数据库也是由NIH创建的。可以为临床医生和研究人员提供有关遗传变异对药物反应影响的信息。
例如,ivacaftor是可口服的CFTR增效剂,可治疗囊性纤维化。PharmGKB中记录了ivacaftor对CFTR的不同类型变异携带者的有效性。
结语
遗传学检测中常用的数据库就介绍到这里。这些数据库对相关文献进行了归纳总结,极大方便判断位点致病性的工作。目前国内也已经陆续出现一些生物信息平台,对各大数据库资源进行整合,尝试提高分析的自动化程度。期待更多国内数据资源和更好用的工具,帮助遗传学检测的发展。
参考资料
[1]https://macarthurlab.org/2017/02/27/the-genome-aggregation-database-gnomad/