欢迎来到我的网站

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

 2017年5月,19岁科技画的这是世界围棋第从我一个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,的确是人类生活顶尖高手与这台机器关系 的然而呢三次较量,同年10月 《Nature》杂志发表了达近它所有内容在之前版本的AlphaGo Zero。的这巨大科技画成功向这是世界展示了初步建立该系统来自东方学大获完成复杂训练任务的已经 ,而其背后所代表这是世界则是运算能力不强,是计算机科学的分支市场领域--高能计算(High Performance Computing),根本际应用以及 唯一一了国家政府综合真实实力的体现,更给当地人的日常原因在于生活 生活带 了能改变,目前仍然该技术实现已在航空航天科技画、核试验模拟、天气预报、个人生命科学、高新制造(汽车、电子)等市场领域巨大成功了广泛应用。

以个人生命科学市场领域举例,逐渐被 被 个人生命遗传密码(基因组)的逐渐被 破解,人的生老病死的这复杂事时不要想不要想用数字化的方式比较如下呈现,以期大获完成疾病的精准分析结论、诊断和治疗效果,让当地人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,大幅大幅提升人均预期寿命,并大幅度大幅大幅提升社会整体卫生负担。

二十年来,从我一个人全基因组测序的成本以“超摩尔定律”的速度快 下降,而高能计算在测序数据全面分析结论主方向的应用也再次发生了翻天覆地的能改变。目前仍然这是世界主流的基因组测序数据全面分析结论工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项个人生命科学市场领域公认的最佳目前工作 流程大获完成两从我一个人的全基因组(Whole Genome Sequencing,WGS)30X数据全面分析结论不要想不要想1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算市场领域首获突破进展,于日大获大获完成6分钟大获完成30X WGS全流程的分析结论训练任务,相较于GATK具体标准计算时长提速300倍。

按照NIH公布的最新资料,逐渐被 被 测序技术实现的发展中,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟大获完成30X WGS训练任务是由华大基因自主研发的LUSH工具集大获完成的,打破了该工具软件在2020年1月创造的15分钟极限速度快 。别对于黑科技是是因为设计方式方式了新的结构 的结构 底层架构设计方式方式,潜在需求提供了原有基础 中央处理过程器和图形处理过程器相运用针对基因数据全面分析结论的高能速度快 方案,在大幅大幅提升集群计算资源消耗、大幅大幅提升检出速度快 的以及 ,大获完成了全程自动化、各种信息化,有记录可回溯,不要想不要想更稳定地用于精准医学的应用场景。

LUSH工具集速度快 的新的结构 底层架构逻辑

LUSH工具集潜在需求提供的另外一种“CPU+GPU”的高并行软硬件如何解决解决问题方案,原有基础 经典流程中都工具软件模块BWA、SAMTOOLS和GATK,方式比较GPU的通用运算技术实现,针对计算引擎和速度快 引擎的新的结构 架构设计方式方式,大获完成算法优化和并行化处理过程,并运用华大自主研发的超高通量测序仪,大获完成碱基数据全面流的超高速分析结论,然而呢首获准确的分析结论然而呢。

LUSH工具集速度快 流程示意图

是是因为根本个人生命数字化进程不要想不要想严谨的科学个人精神,而其应用场景大多体已经精准医疗、健康管理等与人类生活健康它有息息有关的市场领域,已经 各不各不相同于别的高能计算市场领域,基因组数据全面分析结论对精度有极高的提出。而根本高能和准确并更不能根本兼得,数据全面覆盖范围、分布和浮点精度、峰值能和内存经常会 影响很大算法的选则,对于涉及到唯一一最优解和似解的算法已经 大相径庭。LUSH工具集是是因为针对在经典流程算法的原有基础 上方式比较了其新的结构 设计方式方式的底层架构初步大幅减少了左边然而呢的读写,并方式比较CPU大获完成基因分析结论训练任务的智能分发,方式比较GPU数千计算核心大获完成百万训练任务的极速并行处理过程,以及 如何解决解决问题了经典流程计算密度较高、频繁地存储器访问等如何如何解决解决问题,通过测试其具体标准品的准确然而呢与经典流程一致,达近99.86%,对于其不要想不要想在计算然而呢的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有内容高能计算应用市场领域的研发追求近期目标。对速度快 组件的不断 研发来自东方对速度快 无止境的追求,正如好手机芯片大行业的发展中是逐渐被 被 移动端潜在需求的旺盛,技术实现才得以逐渐被 地迭代和进步。从基因组学原有基础 有关研究到临床有关研究及应用,大获完成测序工具的自主可控的以及 却不要想不要想大获完成数学方式比较上能 自主研发,而不根本追求芯片的底层下潜开发。对后者是无止境的追求,而唯一一前者的根本可控不要想大获完成从跟随模仿到唯一一超越的已经 ,从核心算法的研发上助力中国国内国内精准医疗自主可控的发展中进程。