2013年7月30日
由Julia Karow供稿

作为一个致力于研究人类基因组测序参考材料的团体,瓶中基因联盟(Genome in a Bottle Consortium)计划于明年初发布其首个试点参考材料、高度表征的HapMap样本以及一组高度可信的基因组检测。

该团体最近发布了一组基于公开提供的测序数据之分析进行的高度可信的基因组检测,并着手对测序进行更加详细的描述。

在美国国家标准和技术研究院(NIST)的倡导下,该联盟去年首次召开了研讨会,并于下个月再次举行研讨会,旨在制订基因组指标(CSN 9/5/2012),从而满足实验室呼吁建立可信赖标准以核查其测序运行性能的需求。

“目前,对于变异检测的可信度而言,尚无广泛接受的基因组标准或量化性能指标”,该联盟在最近的会议摘要中提到,“而在声研究、重现研究以及临床监管应用的测量结果中实现可信度需要这样的标准或指标”。

该项目由4个工作小组组成: 第一小组负责选择和设计参考材料;第二小组侧重于生物信息学、数据整合和数据表达;第三小组负责处理测量以描述参考材料;第四小组关注性能指标。

自去年克服最初有关HapMap样本需获得知情同意的顾虑后,该联盟决定采用NA12878样本(该样本来自具有犹他州CEPH血统的一位妇女)作为其试点参考材料。 该样本已广泛用于多个发表的测序研究中。“我们了解目前所从事的工作,这将成为非常棒的试点基因组”,该联盟的组织者以及NIST的团队负责人Marc Salit说。

NIST已经批准发布参考材料,并表示“我们将继续监测已知领域的任何新开发”,该联盟的另一名领导人兼NIST的生物医学工程师Justin Zook表示。

卡瑞尔细胞库最近为该联盟培养了大量NA12878细胞,并提取了DNA,共计8,300小瓶,每瓶10微克,实验室明年将申请索要该等样本。 Salit表示,“据我们所知,已经制备好了最大批的基因组DNA,以便进行基因组研究”这是为基因组研究制备的最大批的基因组DNA了。

由于细胞培养中可能会发生突变,NIST的科学家将采用深度测序和浅度测序相结合的方法对多瓶DNA进行描述,以探求材料的同质性。

此外,NIST计划将DNA送至联盟成员处,这些成员对协助科学家更加详细地描述参考材料倍感兴趣。 截至目前,已有九个小组表示其愿意参与,之后将有更多小组加入其中。 “我们的想法是通过多个平台在多个实验室进行描述”,Zook说。

NIST的研究人员计划采用Life Technologies的SOLiD 和Ion Torrent以及 Illumina的测序平台,以对NA12878进行研究。此外,研究人员希望通过Complete Genomics获得测序数据,包括根据其长片段读取技术获得的数据以及从测序平台的出售商处获得的数据。“各主要平台的出售商均表示,产生参考材料时,其将对参考材料进行描述”, Salit说。

太平洋生物科学公司在与威尔康乃尔医学院和其他地方的学术小组的协力合作下,一直在对NA12878进行测序,其计划为瓶中基因联盟提供帮助,但是他们采用的是不同批的DNA,Zook指出。 “我们不指望不同批的DNA之间会出现较大差异,但是,我们需要确认可能存在哪些差异”, Zook说。 该小组已经产生约20倍至30倍的覆盖度,其计划提高到50倍至60倍,Zook补充说。

瓶中基因联盟计划于明年初发布NA12878 DNA以作为NIST的官方参考材料,此外,还会发布一组高度可信的单核苷酸多态性(SNP)和插入缺失。 该联盟将随着时间对变异情况进行更新,并扩展至结构变异和基因组的复杂区域。

同时,NIST的科学家已开发出从样本可用的多个数据集中识别高度可信的基因型检测(包括纯合子参考检测)的方法,其目前正着手在某期刊上发表该方法。

截至目前,科学家们已从用于NA12878的共计12个数据集中识别出一组高度可信的SNP和插入缺失,并将相关变异文档发布到上月与国家生物技术信息中心共同建立的新的FTP网站上。

Zook 解释说,FTP网站“目前仍在积极开发中“。该网站同样包括由Illumina、SOLiD、Complete Genomics、Ion Torrent、454、PacBio和Sanger测序平台生成的数据集。

最终,该网站将汇集大量瓶中基因联盟计划开发的、适用于所有参考基因组的原始数据文件、序列文件和变异检测文件。

NIST已将其一组可信变异分送至至少12个小组,包括学术和政府实验室以及协助改善检测的临床实验室。 “由于许多人已经常对NA12878进行测序,他们发现此类检测对探询其所用方法的正确度是非常有用的,尤其是有利于人们进一步了解变异检测中哪些内容可信、哪些不可信”,Zook说。

该联盟正与基因组比较和分析测试委员会(GCAT)开展合作(BI 4/19/2013),以汇集其高度可信的基因型检测,使得用户可以将不同生物信息学方法进行比较,以了解此类方法对变异检测的具体效果。 “我们认为,对于我们社会而言,这将成为真正有价值的资源”, Zook说。

此外,该联盟正与美国疾病控制与预防中心的基因检测参考材料协调项目(GeT-RM)开展密切协作,以汇集GeT-RM最近发布的数据。“可能会产生大量重复”, Zook表示,并指出上述两个项目均会使用对方的数据。

除了将NA12878开发成为其试点参考材料外,瓶中基因联盟还在调查比HapMap样本使用更广、最近知情批准的其他样本,以将该等样本作为参考材料。

特别是,该联盟最近获得已参与哈佛医学院的个人基因组项目的中国裔父子三元样本,其刚刚向卡瑞尔提交了大批量增加此类样本的细胞的请求,并希望在今年底可以向其提供。“我们的计划是在未来一两年内拥有一组约8个家庭的样本,至少为具有PGP或不同血统的母-父-子三元样本”,Zook补充说。

与人类基因组类似,该联盟正在开发可在测序试验中作为激增控制使用的合成DNA序列,以确定突变的检测限度,由于体细胞突变的出现频率较低,这对癌症测序尤其重要。

到目前为止,该联盟已开发出大小约为1千碱基的合成DNA标准序列,但是,仍有可能开发出大小高达10千碱基的合成DNA序列。 尽管如此,目前尚未确定NIST或其他提供商(如公司)可以分配此类激增标准。 据Salit称,多家公司(包括Life Technologies和 Horizon Diagnostics)已明确表示其有兴趣及可能性开发合成参考材料的商用试剂。 “并不是瓶中基因联盟开发的每个参考材料都需要成为NIST的参考材料”, Salit解释说。

此外,该联盟已就将肿瘤/正常细胞株对开发成为参考材料进行了商讨,目前正就此探索各种方案,包括已供使用的肿瘤/正常细胞株的实验室间研究。

在即将于8月15日和16日在NIST召开的研讨会上,瓶中基因联盟计划就继续开展哪些项目做出进一步决定。 “瓶中基因联盟虽然是由NIST领导和组建的,但毫无疑问,该联盟将会走自己的路”,Salit说。“我希望本次研讨会能设定某些决策制定流程。 作为瓶中基因联盟,我们需要进一步向前发展,因此,我们必须做出明智的选择”。

Salit 表示,“本着没有付出就没有回报的精神”,任何人均可参加本次研讨会和加入瓶中基因联盟。