Google发布一款AI工具 帮助基因组数据解读
股友pajkdn
2018-05-03 08:58:49
  • 点赞
  • 209
  •   ♥  收藏
  • A
    分享到:
距离科学家们首次人类基因组测序已经15年了,而如何使编码人类生命的庞大基因组数据变得有意义依然是一个艰巨的挑战。但是,这种类型的问题恰好是机器学习所擅长的。

本周一,Google发布了一个称为DeepVariant的AI工具,使用最先进的AI技术,能够从测序数据建立了一个人类基因组更精确的谱图。

DeepVariant帮助高通量测序读数转化成为一个全基因组图谱。它能够自动鉴别测序数据中小的插入和缺失突变,以及单个碱基对的突变。

高通量测序逐渐成为广泛的应用,使得基因组测序更为简便。但是,使用这样的系统所产生的数据仅仅提供了一个有限的、容易出错的全基因组快照。通常,对于科学家们来说,将那些小的突变与测序过程中所产生的偶然错误区别开来,是有挑战的,尤其是在基因组的重复部分里。这些突变可能会直接与例如癌症这样的疾病相关。

现在,存在一些可以解读这些读数的工具,包括GATK、VarDict,以及FreeBayers。然而,这些软件程序通常使用更简单的统计和机器学习方法,通过尝试排除读取错误来识别突变。

“挑战之一是,在基因组的困难部分,每个工具都会有它的长处和短处,”Brand Chapman谈道。他是哈佛大学公共卫生学院的研究科学家,帮助开发了DeepVariant。“这些困难的区域对于临床测序的重要性在增长,以及对于获得多重方法来说也是重要的。”

Chapman与来自Google Brain团队的研究人员合作。GoogleBrain团队,这个团队专注于AI技术的开发和应用;另一个Alphabet子公司专注于生命科学;DNAnexus是存储基因组数据的云平台,Andrew Carroll担任DNAnexus的副总裁。

在一个名为Geneome in a Bottle(GIAB)的项目中,团队收集了数以百万计的高通量读取以及全基因组测序。GIAB项目是一项公私合作的项目,旨在推广基因组测序工具和技术。他们将数据提供给深度学习系统,并刻意调整模型的参数,直到它可以学会以一个高水平的准确性解读测序数据。

去年,DeepVariant在PrecisionFDA Truth Challenge中赢得了第一名,这是由FDA发起的比赛,旨在促进更加精准的基因测序。

“DeepVariant的成功很重要,因为它表明了在基因组领域,深度学习可以用来自动训练系统,其表现优于复杂的手工操作系统,”Deep Genomics的首席执行官Brendan Frey表示。

DeepVariant的发布是机器学习有望推动基因组学进步的最新标志。

Deep Genomics是尝试通过AI方法(例如深度学习)梳理出疾病的发病基因以及鉴别出潜在的药物治疗的少数几个公司之一。

Frey表示,AI将会逐步变得更好,不仅仅帮助分析基因组数据。“目前阻断药物(开发)的缺口在于我们无法准确地将遗传变异与疾病机制进行对照,并能够利用这些知识快速确定拯救生命的疗法。”

DeepVariant也会在Google 云平台上提供给用户使用。Google和它的竞争对手都在将机器学习功能添加到他们的云平台上,以吸引任何想要使用最新的AI技术的人。

总的来说,在未来几年,人工智能数据将有助于医学的许多方面取得巨大的飞跃。AI有很多机会可以从图像或医疗记录中挖掘出许多不同种类的医疗数据,比如,预测出那些人类医生可能会错过的疾病。

基因组医学代表着一个尤为重大的机遇,因为数据的规模和复杂性是前所未有的。“在历史上第一次,我们测量生物体的能力,以及对它操作的能力,都远远超过我们理解它的能力,”Frey说。“AI是我们解释和处理海量数据的唯一技术。这将彻底改变医学的未来。”
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500