序禎達(dá)生物是中國(guó)領(lǐng)先的多組學(xué)和測(cè)序服務(wù)提供商之一,該公司利用 NVIDIA Parabricks 來加速多組學(xué)分析。借助 Parabricks,序禎達(dá)生物將全基因組測(cè)序的時(shí)間從 7 小時(shí)縮短至 31 分 05 秒,幾乎是使用 CPU 加速的 14 倍。序禎達(dá)生物還通過 Parabricks BWA-Meth 實(shí)現(xiàn)了比對(duì)的顯著提速,與傳統(tǒng)比對(duì)方法相比,將甲基化比對(duì)的速度提升了 21 倍。
序禎達(dá)生物將前沿的多組學(xué)技術(shù)引入中國(guó)市場(chǎng),為廣泛的商業(yè)用戶群體提供服務(wù),是中國(guó)領(lǐng)先的多組學(xué)服務(wù)提供商之一。公司提供下一代測(cè)序(NGS)和多組學(xué)服務(wù),其分布式測(cè)序?qū)嶒?yàn)室每月產(chǎn)生超過 1.5 PB 的數(shù)據(jù),為下游分析提供了大量有價(jià)值的數(shù)據(jù)。
序禎達(dá)生物處于測(cè)序技術(shù)的前沿,支持基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、微生物組學(xué)和多組學(xué)研究,通過精準(zhǔn)測(cè)序和多組學(xué)解決方案為生命科學(xué)領(lǐng)域帶來革新。
作為中國(guó)首家使用 NVIDIA GPU 加速片段分析的 NGS 公司,序禎達(dá)生物是該領(lǐng)域公認(rèn)的領(lǐng)導(dǎo)者和創(chuàng)新者,其旗下設(shè)有兩大主要業(yè)務(wù)部門:
FLASH-SEQ:一個(gè)覆蓋中國(guó)多個(gè)城市的 NGS 測(cè)序平臺(tái)。序禎達(dá)生物擁有 10 個(gè)實(shí)驗(yàn)室,是中國(guó)最大的 NGS 測(cè)序服務(wù)供應(yīng)商之一。
序禎達(dá)多組學(xué):中國(guó)最大的多組學(xué)供應(yīng)商之一,專注為制藥公司的臨床和研究階段提供服務(wù)。自 2021 年以來,序禎達(dá)生物已在中國(guó)開展了 300 多個(gè)隊(duì)列研究。
序禎達(dá)生物聯(lián)合創(chuàng)始人兼首席信息官費(fèi)家俊表示:“我們?yōu)榭蛻籼峁臐駥?shí)驗(yàn)室到干實(shí)驗(yàn)室的整體解決方案。我們看到了 GPU 在加速生命科學(xué)發(fā)現(xiàn)方面的巨大潛力,正在開展多項(xiàng)業(yè)內(nèi)革命性工作,以實(shí)現(xiàn)我們下一代基因測(cè)序生產(chǎn)力的數(shù)字化?!?/p>
借助 NVIDIA 的技術(shù)加速分析
作為中國(guó)最大的測(cè)序中心之一,序禎達(dá)生物的測(cè)序儀會(huì)產(chǎn)生海量數(shù)據(jù)。因此,序禎達(dá)生物需要一個(gè)能夠處理大規(guī)模數(shù)據(jù)集并簡(jiǎn)化分析的解決方案。該團(tuán)隊(duì)采用了 NVIDIA Parabricks,這是一個(gè)用于二級(jí)分析的可擴(kuò)展基因組學(xué)軟件套件,提供經(jīng) GPU 加速的可信開源工具版本。
費(fèi)家俊回憶道:“2021 年,我們引入了 NVIDIA Parabricks 和 GPU,利用這些技術(shù)加速多組學(xué)分析工作負(fù)載。此次合作旨在借助 Parabricks 平臺(tái)來加速多組學(xué)分析。我們看到了 AI 在助力科學(xué)研究以及加快研究進(jìn)程、為客戶提供更多支持方面的巨大潛力。”
Parabricks 將基因組處理速度提升“百倍”
序禎達(dá)生物使用 Parabricks 來加速WES(外顯子組測(cè)序)和WGS(全基因組測(cè)序)。此前,該公司在使用基因組分析工具包(GATK)和 CPU 時(shí)遭遇了顯著的延遲問題。使用 GATK 時(shí),WES需要 15 個(gè)小時(shí)完成,WGS則需要 50 個(gè)小時(shí)。使用 CPU 加速后,WES時(shí)間降至 2 個(gè)小時(shí),WGS時(shí)間降至 7 個(gè)小時(shí)。
但將 Parabricks 應(yīng)用于這兩種類型的檢測(cè)后,速度得到了顯著提升。借助 Parabricks,WES僅需 2 分 37 秒,速度幾乎是 CPU 加速方法的 46 倍,是 GATK 的近 344 倍。WGS僅需 31 分 05 秒,速度幾乎是 CPU 加速的 14 倍,是 GATK 的近 97 倍。
這種加速直接影響患者治療效果,因?yàn)閿?shù)據(jù)分析以往通常是瓶頸所在。序禎達(dá)生物信息技術(shù)總監(jiān)王佳偉解釋說:“使用 GATK 工作負(fù)載時(shí),從WGS數(shù)據(jù)中獲取單個(gè)樣本結(jié)果需要花費(fèi) 30-50 個(gè)小時(shí)。而使用 Parabricks 之后,我們可以將時(shí)間縮短至不到 1 小時(shí)?!?/p>
數(shù)據(jù)和基準(zhǔn)測(cè)試由序禎達(dá)生物提供Parabricks 將甲基化比對(duì)加速 21 倍
Parabricks 的結(jié)果不僅與開源工具一致(這保障了研究的可重復(fù)性和透明度),還能顯著加速一直以來耗時(shí)的分析步驟。除了加速全外顯子組測(cè)序和全基因組測(cè)序之外,序禎達(dá)生物還希望改進(jìn)甲基化比對(duì)。
對(duì)于經(jīng)亞硫酸氫鹽處理的 DNA 測(cè)序讀數(shù)(BS-Seq)的比對(duì),則使用了 BWA-Meth 來檢測(cè) DNA 甲基化。在一個(gè) 110GB 的數(shù)據(jù)集上,使用傳統(tǒng)方法完成比對(duì)需要 21 個(gè)小時(shí)。而使用 8 塊 NVIDIA T4 GPU 以及 Parabricks 中經(jīng) GPU 加速的 BWA-Meth 版本,比對(duì)時(shí)間縮短至僅 1 個(gè)小時(shí)。與傳統(tǒng)方法相比,使用 Parabricks 進(jìn)行甲基化比對(duì)的速度提升了 21 倍。
數(shù)據(jù)和基準(zhǔn)測(cè)試由序禎達(dá)生物提供NVIDIA CUDA-X 數(shù)據(jù)科學(xué)庫將單細(xì)胞分析提升至 “秒級(jí)”
序禎達(dá)生物支持多種應(yīng)用場(chǎng)景的工作負(fù)載,包括單細(xì)胞分析。然而,單細(xì)胞數(shù)據(jù)處理可能極其耗時(shí),尤其是在數(shù)據(jù)集規(guī)模不斷擴(kuò)大的情況下。
NVIDIA CUDA-X Data Science(RAPIDS)是一套開源的 GPU 加速的數(shù)據(jù)科學(xué)和 AI 庫,可提升整個(gè)數(shù)據(jù)工作流的性能。CUDA-X DS 常用于基因組學(xué)應(yīng)用中的單細(xì)胞分析和三級(jí)分析。序禎達(dá)生物發(fā)現(xiàn),在一個(gè)包含 70,000 個(gè)人類肺細(xì)胞的數(shù)據(jù)集上,與 Scanpy 相比,使用 CUDA-X DS 可以顯著加速預(yù)處理步驟。使用 Scanpy 時(shí),預(yù)處理需要 37 分鐘完成,而使用 CUDA-X DS 時(shí),該步驟僅需約 22 秒,速度提升了近 101 倍。
數(shù)據(jù)和基準(zhǔn)測(cè)試由序禎達(dá)生物提供賦能一整套解決方案
從加速甲基化比對(duì)到縮短單細(xì)胞分析的預(yù)處理時(shí)間,序禎達(dá)生物借助了多種 NVIDIA 技術(shù)來減少運(yùn)行時(shí)間。通過利用 NVIDIA 的硬件和軟件(包括 T4 GPU、Parabricks 和 CUDA-X DS),序禎達(dá)生物加速了一直以來耗時(shí)的流程。因此,NVIDIA 提供的完整解決方案使序禎達(dá)生物能夠應(yīng)對(duì)各種不同的應(yīng)用場(chǎng)景,并為客戶帶來即時(shí)價(jià)值。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109731 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135449
原文標(biāo)題:序禎達(dá)生物借助 NVIDIA Parabricks 將甲基化比對(duì)速度提升 21 倍
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護(hù)科學(xué)
NVIDIA 利用全新開源模型與仿真庫加速機(jī)器人研發(fā)進(jìn)程
燧弘華創(chuàng)與泰達(dá)生物簽署AI醫(yī)療健康領(lǐng)域戰(zhàn)略合作協(xié)議
電焊機(jī)EMC測(cè)試整改:基于200+案例的統(tǒng)計(jì)學(xué)分析
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
達(dá)實(shí)智能攜手信達(dá)生物打造智慧園區(qū)新標(biāo)桿
NVIDIA全棧加速代理式AI應(yīng)用落地
全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率
NVIDIA攜手微軟加速代理式AI發(fā)展
借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
序禎達(dá)生物利用NVIDIA Parabricks技術(shù)加速多組學(xué)分析
評(píng)論