數(shù)據(jù)體量激增、商業(yè)探索初顯,基因檢測步入智能化時(shí)代?

2017年,伴隨Illumina旗下NovaSeq系列基因測序儀上市,全基因組測序成本被進(jìn)一步拉低到不足1000美元。一時(shí)間,全球基因數(shù)據(jù)體量和解析需求激增。彼時(shí),動(dòng)脈網(wǎng)曾預(yù)測,作為基因科技行業(yè)爆發(fā)的第二曲線,如何更快速、準(zhǔn)確地進(jìn)行基因數(shù)據(jù)分析和解讀,將會(huì)成為關(guān)鍵命題。

 

如今,互聯(lián)網(wǎng)和科技巨頭入局推動(dòng)信息技術(shù)(IT)與生物技術(shù)(BT)相融合,似乎正在印證當(dāng)時(shí)的推測。在生物信息學(xué)家眼里,人體就是一個(gè)程序,是由基因組這個(gè)程序控制的化學(xué)反應(yīng)與物理變化。測序樣本數(shù)據(jù)在實(shí)驗(yàn)室中產(chǎn)生,而后與信息系統(tǒng)中沉淀的數(shù)據(jù)相比對,從而發(fā)現(xiàn)突變點(diǎn)位,并以此為基礎(chǔ)解讀出終端可用的結(jié)果。當(dāng)基因測序數(shù)據(jù)量仍處于爬坡階段,IT的角色是針對特定問題的各種專業(yè)分析工具。而眼下的數(shù)據(jù)規(guī)模漸已超出分析工具的承受極限,云計(jì)算、超高性能芯片加速、人工智能算法開始定義“IT+BT”的底層邏輯。

 

從科研服務(wù)到臨床應(yīng)用,從腫瘤診療到感染病防治,基因科技的商業(yè)化場景層出不窮,明星產(chǎn)品和公司總在輪換。到底什么才是構(gòu)筑基因公司之根本的核心競爭力?我們?yōu)楹未藭r(shí)重提基因數(shù)據(jù)話題?多年前設(shè)想以信息技術(shù)迭代基因科技的圖景是否顯現(xiàn)?本報(bào)告將試圖揭曉答案。

 

在報(bào)告中,我們通過行業(yè)及產(chǎn)品梳理、專家訪談,總結(jié)出關(guān)于基因檢測智能化的以下核心觀點(diǎn),以饗讀者。


核心觀點(diǎn)

1、國內(nèi)外基因測序上游競爭格局板塊移動(dòng)明顯,將撬動(dòng)中游服務(wù)商深度洗牌;


2、認(rèn)知紅利趨盡,基因檢測服務(wù)商轉(zhuǎn)而重視修煉內(nèi)功,數(shù)據(jù)能力建設(shè)是核心;


3、新藥、科研與臨床基因大數(shù)據(jù)分析需求井噴,臨床數(shù)據(jù)挖掘潛力巨大;


4、區(qū)域與企業(yè)平臺建設(shè)加速,標(biāo)準(zhǔn)與規(guī)范夠艱難,基因數(shù)據(jù)庫涉深水區(qū);


5、上游測序與下游應(yīng)用均趨成熟,數(shù)據(jù)庫依然掣肘基因科技步入智能化;


6、頭部企業(yè)基因智能化產(chǎn)品與服務(wù)頻出,但研發(fā)與應(yīng)用整體仍處于起步階段。


基因檢測智能化現(xiàn)狀與機(jī)遇


基因檢測是指對人類的DNA、RNA、蛋白質(zhì)及代謝物進(jìn)行分析,以診斷、預(yù)測或預(yù)防遺傳性疾病的發(fā)生,指導(dǎo)疾病治療方案的選擇(藥物種類及劑量的選擇),或預(yù)測疾病的復(fù)發(fā),也可以作為評估個(gè)人體質(zhì)或特質(zhì)的依據(jù)。目前,用于進(jìn)行基因檢測的技術(shù)主要分為PCR技術(shù)、基因測序技術(shù)、FISH技術(shù)和基因芯片技術(shù)四種?;诨虼髷?shù)據(jù)的應(yīng)用,測序技術(shù)成為最為主流的基因檢測技術(shù)。
 
以二代基因測序(NGS)技術(shù)為例,基因測序的流程包括樣本采集、數(shù)據(jù)生產(chǎn)、數(shù)據(jù)分析、數(shù)據(jù)解讀與轉(zhuǎn)化應(yīng)用等環(huán)節(jié)。如今NGS技術(shù)依然依靠人工操作,無法避免人工對于數(shù)據(jù)生產(chǎn)質(zhì)量的影響以及人工帶來的數(shù)據(jù)生產(chǎn)成本和時(shí)間限制;需處理的基因數(shù)據(jù)規(guī)模龐大,最大可達(dá)到PB或EB級別,以及數(shù)據(jù)分析采用的生物信息分析算法十分復(fù)雜使得數(shù)據(jù)分析環(huán)節(jié)繁瑣,效率低,耗時(shí)長。

政策法規(guī):新醫(yī)改與生命健康新基建推動(dòng)基因檢測行業(yè)跑步進(jìn)入智能化行業(yè)

2017年,《國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》中提到基于人工智能開展大規(guī)?;蚪M識別、蛋白組學(xué)、代謝組學(xué)等研究和新藥研發(fā),推進(jìn)醫(yī)藥監(jiān)管智能化。因此,基因測序的智能化生產(chǎn)體系是必然趨勢,有助于基因數(shù)據(jù)生產(chǎn)的流程規(guī)范化、數(shù)據(jù)的全程質(zhì)控以及測序成本和時(shí)間的控制。
 
基因檢測行業(yè)的發(fā)展目前仍由技術(shù)驅(qū)動(dòng),但是相關(guān)政策環(huán)境也為基因檢測智能化的發(fā)展提供充足的養(yǎng)料。

生命健康新基建。2020年4月的國務(wù)院常務(wù)會(huì)議中將新型基礎(chǔ)設(shè)施(簡稱“新基建”)定義為以新發(fā)展理念為引領(lǐng),以技術(shù)創(chuàng)新為驅(qū)動(dòng),以信息網(wǎng)絡(luò)為基礎(chǔ),面向高質(zhì)量發(fā)展需要,提供數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新等服務(wù)的基礎(chǔ)設(shè)施體系。
 
2020年4月,國務(wù)院應(yīng)對新型冠狀病毒肺炎疫情防聯(lián)控機(jī)制發(fā)布《關(guān)于進(jìn)一步做好疫情期間新冠病毒檢測有關(guān)工作的通知》:明確三級綜合醫(yī)院均應(yīng)當(dāng)建立符合生物安全二級及以上標(biāo)準(zhǔn)的臨床檢驗(yàn)實(shí)驗(yàn)室,獨(dú)立開展新型冠狀病毒檢測;對醫(yī)療資源相對缺乏、檢測能力相對薄弱的地區(qū),選擇1家綜合實(shí)力強(qiáng)的縣級醫(yī)療機(jī)構(gòu)予以重點(diǎn)支持,實(shí)現(xiàn)縣域內(nèi)醫(yī)療機(jī)構(gòu)具備核酸檢測能力。

近年來,我國將基因檢測作為國家重點(diǎn)領(lǐng)域,加大了支持力度,先后推出了多項(xiàng)政策、制度進(jìn)行扶持,為行業(yè)的發(fā)展創(chuàng)造了良好的政策環(huán)境,同時(shí)也逐步收緊了對基因檢測的監(jiān)管。
 
2021年3月,《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》正式發(fā)布,明確“基因與生物技術(shù)”作為七大科技前沿領(lǐng)域攻關(guān)領(lǐng)域之一;“生物技術(shù)”作為九大戰(zhàn)略性新興產(chǎn)業(yè)之一,其中“基因技術(shù)”為未來產(chǎn)業(yè)。
 
2016年,我國過先后發(fā)布了多條與之相關(guān)的關(guān)鍵性國家政策,基因檢測經(jīng)歷了從產(chǎn)業(yè)發(fā)展倒逼政策改革,到以政策引導(dǎo)產(chǎn)業(yè)發(fā)展的階段。2016年4月15日,國家發(fā)改委頒布了《國家發(fā)展改革委辦公廳關(guān)于第一批基因檢測技術(shù)應(yīng)用示范中心建設(shè)方案的復(fù)函》,正式批復(fù)建設(shè)全國27個(gè)基因檢測技術(shù)應(yīng)用示范中心,鼓勵(lì)加快基因檢測產(chǎn)業(yè)的快速發(fā)展。
 
2017年,我國啟動(dòng)十萬人基因組計(jì)劃,十三五規(guī)劃將發(fā)展基因技術(shù)作為生物醫(yī)藥產(chǎn)業(yè)創(chuàng)新的核心任務(wù),由此,以基因技術(shù)為核心的生物產(chǎn)業(yè)獲得快速發(fā)展,并帶動(dòng)基因測序行業(yè)邁入爆發(fā)期。
 
2019年,《健康中國行動(dòng)(2019-2030年)》明確提出“加快推動(dòng)從以治病為中心”轉(zhuǎn)變?yōu)椤耙匀嗣窠】禐橹行摹?,提出預(yù)防是最經(jīng)濟(jì)、最有效的健康策略,而基因檢測是最有效的預(yù)防手段,隨著“健康中國2030”上升為國家戰(zhàn)略。

市場規(guī)模:精準(zhǔn)醫(yī)療需求之井噴態(tài)勢與基因檢測成本之超摩爾定律下降

基因檢測市場空間隨著2015年二代測序技術(shù)的上市迅速打開。二代測序技術(shù)憑借通量大、準(zhǔn)確度高、價(jià)格低廉的優(yōu)勢成為當(dāng)前主流的基因檢測技術(shù),引領(lǐng)行業(yè)迅速發(fā)展。醫(yī)療的未來無疑是精準(zhǔn)醫(yī)療,國家鼓勵(lì)和支持發(fā)展以基因測序?yàn)榛A(chǔ)的精準(zhǔn)醫(yī)療??萍疾吭?015年3月首次召開的“國家精準(zhǔn)醫(yī)療戰(zhàn)略專家會(huì)議”中提出2030年前政府?dāng)M投入600億元發(fā)展精準(zhǔn)醫(yī)療。根據(jù)預(yù)測,全球基因檢測市場規(guī)模將從2019年的122億美元增長至2024年的280億美元,年復(fù)合增長率高達(dá)18.08%;國內(nèi)基因檢測市場將從 2019 年的106.54億元增長至2026年的281.34億元,未來市場空間十分可觀。
 
基因測序技術(shù)的進(jìn)步帶動(dòng)了基因測序成本大幅下降,遠(yuǎn)超摩爾定律。根據(jù) National Human Genome Research Insititute 公布的數(shù)據(jù),2001年平均每兆堿基的測序成本是5292.4美元,單人類基因組測序成本是9526.3萬美元。2006年美國第二代基因測序企業(yè)454 Life Science 推出超高通量基因組測序系統(tǒng),二代測序技術(shù)的產(chǎn)生使得平均每兆堿基的測序成本下降至581.9美元,單人類基因組測序成本下降至1047.5萬美元。隨著新技術(shù)和新測序設(shè)備的推出,此后基因測序成本以超“摩爾定律”的速度不斷下降,至2020年平均每兆堿基的測序成本低至0.01美元,單人類基因組測序成本低至689美元。

成長階段:疾病關(guān)系、算法驗(yàn)證相對復(fù)雜,基因檢測智能化尚處于早期

數(shù)字化大潮下,智能化為基因檢測技術(shù)賦能,通過將數(shù)據(jù)分析流程所需的設(shè)備、生物信息分析軟件、數(shù)據(jù)庫與人工智能技術(shù)結(jié)合在一起,實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)分析和智能決策系統(tǒng),促進(jìn)基因檢測行業(yè)高質(zhì)量發(fā)展,然而數(shù)據(jù)分析算法、基因組與疾病之間的關(guān)系的復(fù)雜性使基因檢測智能化處于早期發(fā)展階段。
 
然而,知易行難,基因檢測智能化仍然面臨許多技術(shù)壁壘。
 
大數(shù)據(jù)庫。如今基因檢測技術(shù)發(fā)展得十分成熟,很多企業(yè)都能生產(chǎn)基因數(shù)據(jù),然而基因數(shù)據(jù)的解讀卻非常困難,因?yàn)榛蚺c疾病的關(guān)系復(fù)雜,并且依賴于用來解釋不確定遺傳檢測結(jié)果的大數(shù)據(jù)庫,以此才能將基因數(shù)據(jù)轉(zhuǎn)化成臨床決策。
 
數(shù)據(jù)分析算法。隨著基因組數(shù)據(jù)的迅速增加和所需要分析解讀的突變類型日益復(fù)雜,表型和醫(yī)療數(shù)據(jù)也不斷豐富,對數(shù)據(jù)分析算法提出了更高的要求。
 
業(yè)務(wù)模塊復(fù)雜。基因檢測智能化能力的構(gòu)建是圍繞數(shù)據(jù)生產(chǎn)、傳輸、分析、應(yīng)用的全生命周期流程進(jìn)行,業(yè)務(wù)模塊的復(fù)雜和對數(shù)據(jù)安全更敏感等原因,使得基因檢測技術(shù)難以完美地與數(shù)字技術(shù)結(jié)合在一起,未來基因檢測智能化還有很長的道路要走。
 
雖然基因檢測智能化還處于早期階段,但發(fā)展迅猛,國內(nèi)已有產(chǎn)品上市,例如華大基因的生信分析一體機(jī)HALOS和諾禾致源的一站式解決方案Falcon柔性智能生產(chǎn)系統(tǒng)等。

資本熱度:計(jì)算機(jī)、互聯(lián)網(wǎng)、基因測序平臺巨頭紛紛入局撬動(dòng)行業(yè)變革

截至報(bào)告發(fā)布,2021年,中國基因檢測行業(yè)共發(fā)生了106起融資交易事件,披露融資交易總額達(dá)213億元,相比2020年增加10%(2020年約193億元)。2021年融資交易事件較2020年增加32起,但融資額相差不多的主要原因是缺少類似華大智造在2020年4月完成超10億美元的超大融資事件。
 
從2015年到2021年的融資額和融資事件來看,2020年是基因檢測行業(yè)融資交易事件的高峰期,年增長率高達(dá)153%,而2021年延續(xù)了基因檢測的融資熱潮,資本持續(xù)關(guān)注。
 
目前,我國基因檢測行業(yè)的融資集中在測序儀及試劑耗材生產(chǎn)企業(yè)上,而國外同時(shí)期的投資方向主要集中在基因數(shù)據(jù)分析領(lǐng)域,且多數(shù)企業(yè)已進(jìn)入后期階段。另外,國外的產(chǎn)業(yè)結(jié)構(gòu)和資本市場比國內(nèi)成熟,獨(dú)角獸企業(yè)(包括未上市和上市企業(yè))覆蓋基因行業(yè)上、中、下游,主要業(yè)務(wù)涉及儀器及試劑研發(fā)、科研和臨床基因檢測服務(wù)以及數(shù)據(jù)分析等。由于測序技術(shù)壁壘高,國內(nèi)僅有幾家公司能夠自主研發(fā)基因測序儀等設(shè)備,多數(shù)企業(yè)集中于數(shù)據(jù)分析、試劑耗材生產(chǎn)和中游的檢測服務(wù)。而我國2021年獲得融資的企業(yè)大多處于B輪及以前的階段,表明國內(nèi)基因數(shù)據(jù)生產(chǎn)及分析還處于早期產(chǎn)品化階段。
 
基因大數(shù)據(jù)擁有廣闊的應(yīng)用場景和市場,是醫(yī)療健康領(lǐng)域能最快大規(guī)模轉(zhuǎn)化應(yīng)用的行業(yè)。而PB級別的基因大數(shù)據(jù)的分析與運(yùn)用離不開云計(jì)算、人工智能、大數(shù)據(jù)、5G、區(qū)塊鏈等數(shù)字技術(shù)。IT企業(yè)擅長的數(shù)字技術(shù)的數(shù)據(jù)規(guī)模大、強(qiáng)大算力和算法以及安全可靠賦能基因行業(yè),為傳統(tǒng)基因檢測行業(yè)帶來生產(chǎn)力的變革。

市場角色:5大角色構(gòu)筑生態(tài),初代產(chǎn)品已進(jìn)入市場推動(dòng)檢測效率提升

基因檢測行業(yè)一般由生命數(shù)字化信息的采集、數(shù)據(jù)生產(chǎn)、分析、解讀與轉(zhuǎn)化應(yīng)用等5大環(huán)節(jié)構(gòu)成,基于大數(shù)據(jù)實(shí)現(xiàn)大規(guī)模人群的精準(zhǔn)醫(yī)療和全生命周期管理。
微信圖片_20211124134121.jpg
基因檢測行業(yè)價(jià)值鏈

數(shù)據(jù)分析是運(yùn)用生物信息分析對下機(jī)數(shù)據(jù)進(jìn)行處理和分析,涉及數(shù)據(jù)存儲(chǔ)、計(jì)算、管理等基礎(chǔ)設(shè)施以及分析所需的軟件、算法以及新的數(shù)字技術(shù)。
 
布局?jǐn)?shù)據(jù)分析的企業(yè)主要圍繞生物信息軟件開發(fā)、基因大數(shù)據(jù)平臺解決方案、基因大數(shù)據(jù)增值服務(wù)3種業(yè)務(wù)展開。軟件方面國內(nèi)多數(shù)為非小細(xì)胞肺癌突變基因軟件,獲批的企業(yè)有華大生物、吉因加、燃石以及世和醫(yī)療。
 
數(shù)據(jù)解讀是將基因檢測結(jié)果與臨床表型相結(jié)合,挖掘基因與疾病的關(guān)系,從而進(jìn)行基礎(chǔ)研究和指導(dǎo)臨床決策。在科研服務(wù)上,諾禾致源采用多組學(xué)聯(lián)合分析方法揭示疾病機(jī)理并提出潛在治療方法。臨床上,智因東方開創(chuàng)了“生物+遺傳+臨床”三要素分析原則的臨床分析算法,提高了臨床診斷效率。
 
基因檢測目前在醫(yī)療健康領(lǐng)域中廣泛運(yùn)用于科研級、臨床級和消費(fèi)級場景。
 
科研領(lǐng)域的基因檢測業(yè)務(wù)主要面向科研機(jī)構(gòu),包括基因組測序、轉(zhuǎn)錄組學(xué)測序、表觀組學(xué)測序、宏基因組學(xué)系列測序、單細(xì)胞測序等。國內(nèi)基因檢測科研市場相對飽和,提供基礎(chǔ)科研基因檢測服務(wù)的企業(yè)主要有諾禾致源、華大基因、貝瑞基因、求臻醫(yī)學(xué)、安諾優(yōu)達(dá)等。臨床級應(yīng)用主要是臨床基因診斷,包括出生缺陷防控、腫瘤診斷、傳染病診斷等領(lǐng)域。

基因檢測智能化產(chǎn)業(yè)鏈與應(yīng)用


基因行業(yè)正在進(jìn)入大數(shù)據(jù)時(shí)代。
 
人類基因組中蘊(yùn)藏海量數(shù)據(jù)。DNA(脫氧核糖核酸)是一種雙鏈聚合物,由4種攜帶不同堿基的脫氧核糖核苷酸(A、T、C、G)排列組合形成。堿基或脫氧核糖核苷酸數(shù)量是衡量DNA長度的標(biāo)準(zhǔn),由1000個(gè)脫氧核糖核苷酸組成的DNA長度為1Kb,完整的人類基因組包含約32億對堿基,長度為3Gb左右。同時(shí),基因的相互差異形式十分多樣,例如單核苷酸突變、基因片段重復(fù)和缺失、染色體變異、甲基化等不改變DNA序列的表觀遺傳學(xué)變異,從而基因信息數(shù)量龐大、結(jié)構(gòu)復(fù)雜。

隨著基因產(chǎn)業(yè)持續(xù)發(fā)展,基因測序數(shù)量逐漸增多,這些海量數(shù)據(jù)及其治理需求逐漸浮出水面。由此,基因技術(shù)與人工智能的融合,從作為基因檢測輔助環(huán)節(jié)的生物信息分析中脫穎而出,成為蓬勃發(fā)展的行業(yè)。
 
在基因科技智能化產(chǎn)業(yè)的最上游,仍然通過專門的設(shè)備和試劑獲取下機(jī)測序數(shù)據(jù),這項(xiàng)工作在當(dāng)前已經(jīng)發(fā)展得比較成熟,也已經(jīng)形成了測序儀和配套試劑相對成熟的供給側(cè)結(jié)構(gòu)。從測序儀的型號看,Illumina的HiSeq是目前市場上最主流的測序儀。
 
不過,受制于有限的生物信息技術(shù)水平,對海量的測序數(shù)據(jù)的正確解讀其實(shí)是基因檢測中亟待解決的難題。越來越多企業(yè)開始布局上游測序平臺。例如,Pac Bio所展開的對端讀長測序技術(shù)的收購、菲鵬生物收購高通量測序平臺等。
 
基因數(shù)據(jù)原始狀態(tài)是以ATCG為標(biāo)識的堿基序列。從基因測序儀運(yùn)行下來提取的原始數(shù)據(jù)類似計(jì)算機(jī)二進(jìn)制數(shù)字序列,不能直接提供關(guān)于疾病的信息,最終轉(zhuǎn)化為人們可理解的生物學(xué)數(shù)據(jù),為疾病診斷和治療提供指導(dǎo)。還需要借助專業(yè)知識分析。
 
當(dāng)前,基因表達(dá)調(diào)控網(wǎng)絡(luò)、信號傳導(dǎo)網(wǎng)絡(luò)、蛋白-蛋白相互作用網(wǎng)絡(luò)以及代謝網(wǎng)絡(luò)的出現(xiàn)與發(fā)展更使生物信息學(xué)進(jìn)入系統(tǒng)生物學(xué)時(shí)代,如果說生物信息學(xué)發(fā)展初期面對的主要是序列數(shù)據(jù),隨基因組領(lǐng)域研究在質(zhì)與量上的提高,特別在第二、第三代高通量測序技術(shù)的推動(dòng)下,生物信息學(xué)面對的數(shù)據(jù)在類型、本質(zhì)、數(shù)量上都得到了極大豐富,生物信息學(xué)也作為基因組分析不可或缺的工具而得到迅速發(fā)展,并快速向包括人類健康在內(nèi)的很多領(lǐng)域滲透。

測序數(shù)據(jù)處理和分析的技術(shù)壁壘較高,并且因?yàn)槠渲匾裕渤蔀槌钢饣驕y序行業(yè)中游發(fā)展的關(guān)鍵因素,更是各大測序公司的核心競爭力所在。目前,測序數(shù)據(jù)處理流程基本已經(jīng)標(biāo)準(zhǔn)化,但對于數(shù)據(jù)處理過程中的核心步驟,各家公司都有自己的一套分析方法,即使是相同的原始數(shù)據(jù),各方不同同算法對細(xì)節(jié)的處理不盡相同,輸出的結(jié)果也不同,最終反映在測序數(shù)據(jù)解讀質(zhì)量上。
 
基因數(shù)據(jù)正在形成巨大的數(shù)據(jù)庫,它的終極形態(tài)是,每一個(gè)健康人或者患者都可以將自己的基因數(shù)據(jù)進(jìn)行上傳分析,通過比對得出自己的健康狀況,獲得健康建議。不過,這需要很長一段時(shí)間的積累來達(dá)到理想的可靠性與穩(wěn)定性,基因檢測成長為越來越類似血常規(guī)、尿常規(guī)等常規(guī)臨床檢驗(yàn)項(xiàng)目,在一定程度上加速了這個(gè)過程。
 
基因檢測的下游應(yīng)用可以分為臨床應(yīng)用和非臨床應(yīng)用兩個(gè)大類,兩者各自又可以進(jìn)一步細(xì)分為生育健康、病原感染檢測、腫瘤基因檢測、基礎(chǔ)醫(yī)學(xué)研究、新藥研發(fā)等垂直板塊。其中,非臨床應(yīng)用中的基礎(chǔ)醫(yī)學(xué)研究是基因測序最早實(shí)現(xiàn)商業(yè)化的領(lǐng)域,也是當(dāng)前發(fā)展最為成熟的應(yīng)用場景,其次便是臨床場景中的腫瘤基因檢測、生育健康、病原感染監(jiān)測等應(yīng)用。
 
在這個(gè)過程中,生物信息學(xué)不僅是一門學(xué)科,更是一種重要的研究開發(fā)工具,且生物信息學(xué)工具幾乎是未來生物研究/生物醫(yī)藥開發(fā)所必須的,并且生物信息學(xué)作為強(qiáng)大的生物數(shù)據(jù)解讀工具,正是連接基因序列和個(gè)性化醫(yī)療的關(guān)鍵紐帶。當(dāng)今,生物信息學(xué)界的研究人員主要將注意力集中在基因組、蛋白質(zhì)組、轉(zhuǎn)錄組、 RNA 組等組學(xué)以及與這些組學(xué)密切相關(guān)的藥物設(shè)計(jì)上,測序、數(shù)據(jù)庫資源、序列對比、基因芯片&表達(dá)譜分析、分子進(jìn)化分析、蛋白質(zhì)結(jié)構(gòu)分析、藥物設(shè)計(jì)輔助是生物信息學(xué)最常見的相關(guān)應(yīng)用。

基因檢測智能化探索之臨床應(yīng)用


  • 腫瘤


基因科技的臨床應(yīng)用,行至腫瘤診療,才算真正點(diǎn)燃了產(chǎn)業(yè)界的熱情。也正因如此,紅海競爭之下積累的豐富樣本和數(shù)據(jù),使得腫瘤診療成為基因大數(shù)據(jù)治理開發(fā),甚至基于人工智能技術(shù)做解析的排頭兵。
 
早期的蒙眼狂奔之后,臨床上可茲采用的基于中國人群的腫瘤基因數(shù)據(jù)庫已經(jīng)越來越多,但整個(gè)基因信息大數(shù)據(jù)領(lǐng)域仍然缺乏統(tǒng)一標(biāo)準(zhǔn),多個(gè)數(shù)據(jù)孤島并存,大數(shù)據(jù)價(jià)值不能充分被挖掘用于滿足臨床需求。換言之,國內(nèi)基因行業(yè)也亟需建立一套基因檢測樣本采集、運(yùn)輸、儲(chǔ)存、檢測、生物信息分析和遺傳咨詢解讀等標(biāo)準(zhǔn)化流程,用以規(guī)范多基因Panel檢測流程,同時(shí)解決臨床數(shù)據(jù)支持及共享機(jī)制的項(xiàng)目。
 
隨著國內(nèi)大眾對基因科技認(rèn)知不斷加深,和供給側(cè)的基因測序行業(yè)生態(tài)不斷完善,大規(guī)模人群基因數(shù)據(jù)庫的建設(shè)節(jié)奏明顯加快。大多數(shù)腫瘤NGS廠商都將建立和開發(fā)腫瘤基因大數(shù)據(jù)庫作為自身的第二增長曲線,例如華大基因、求臻醫(yī)學(xué)、吉因加、仁東醫(yī)學(xué)、至本醫(yī)療等紛紛布局了針對不同癌種、納入不同體量人群的腫瘤基因數(shù)據(jù)庫。
 
現(xiàn)階段,在一些特定的垂直領(lǐng)域,已經(jīng)有零星基于人工智能的腫瘤基因組解讀產(chǎn)品被嘗試推出。例如,志諾維思旗下的志諾醫(yī)珀(iGenome? Reporter)就是一款NGS基因檢測數(shù)據(jù)分析系統(tǒng)。它基于GVC基因變異探測算法、醫(yī)學(xué)解讀知識庫,快速精準(zhǔn)分析和解讀腫瘤樣本NGS數(shù)據(jù),只需極簡操作就可以從原始測序數(shù)據(jù)獲得全面的臨檢報(bào)告和/或科研報(bào)告,輔助用戶進(jìn)行臨床診療決策和科研產(chǎn)出。
 
由此,腫瘤基因組學(xué)研究的門檻進(jìn)一步被降低,而從事下游產(chǎn)品開發(fā)的小型基因公司再生產(chǎn)和研發(fā)能力得以加強(qiáng)。
 

  • 感染疾病及遺傳病


實(shí)際上,大多數(shù)基因測序公司只是擅長做基礎(chǔ)測序和基本的分子生物學(xué)注釋,對疾病、遺傳機(jī)制缺乏深入了解,與醫(yī)生、研究者這類終端用戶的需求存在差距,輸出結(jié)果也缺少靈活性,在一定程度上增加用戶成本。對于非生信專業(yè)的人而言,原始測序數(shù)據(jù)幾乎毫無實(shí)際意義。
 
遺傳疾病多為多基因?qū)е碌膹?fù)雜疾病。全基因組關(guān)聯(lián)分析是一種和基因測序密切相關(guān)的,近幾年來研究中非常熱門的高通量分析方法。遺傳學(xué)與分子生物學(xué)實(shí)驗(yàn)室常規(guī)分析是將關(guān)心的DNA或蛋白序列與庫比對,這些序列長度大多數(shù)情況比整個(gè)基因組的量級小得多,進(jìn)行的分析通量也低。但近年來,隨生物數(shù)據(jù)量的增加以及單基因研究的局限性,生物信息學(xué)相關(guān)高通量分析方法已越來越成為必須,特別測序成本的快速下降,以及生物信息學(xué)的快速發(fā)展,高通量分析方法的應(yīng)用門檻進(jìn)一步降低,全基因組關(guān)聯(lián)性分析正是研究中最為常見的、應(yīng)用越來越常規(guī)化的生物信息學(xué)高通量分析手段之一。
 
對人類基因組研究而言,全基因組關(guān)聯(lián)分析(GWAS)是指在人類全基因組范圍內(nèi)找出單核苷酸多態(tài)性(SNP)數(shù)據(jù),并從中篩選出與目標(biāo)特征(如胖瘦、高矮、特定疾病、藥物敏感性等)相關(guān)的SNPs。在GWSA中,研究人員通常先收集到足夠多的患者基因組數(shù)據(jù),再將其中的SNP位點(diǎn)與對照組進(jìn)行比較,并將相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,嘗試建立序列數(shù)據(jù)與目標(biāo)性狀之間的關(guān)聯(lián),從而篩選出同目標(biāo)性狀相關(guān)性密切的潛在基因。往往在這一步干試驗(yàn)完成之后,還需要采用實(shí)驗(yàn)生物學(xué)的方法做驗(yàn)證和深入研究。這種方式將更多維的海量數(shù)據(jù)納入研究,已經(jīng)幫助研究者發(fā)現(xiàn)了許多未知基因以及染色體區(qū)域,為復(fù)雜疾病的發(fā)病機(jī)制提供了更多的線索。

  • 消費(fèi)級基因檢測


消費(fèi)級基因檢測是指通過廣告、電商、線下店可被消費(fèi)者認(rèn)知且直接購買的基因檢測產(chǎn)品,主要以低通量檢測為主,技術(shù)手段包括 PCR 和基因芯片。在中國消費(fèi)基因發(fā)展相對早期,產(chǎn)品主要圍繞健康管理等維度展開。
 
中國消費(fèi)級基因檢測服務(wù)市場成立相對美國來講晚了20年,目前處于初期發(fā)展階段。但是中國消費(fèi)者如今還未完全認(rèn)可并采用消費(fèi)級基因檢測服務(wù)作為健康管理的手段,然而基于中國的人口眾多和老齡化及個(gè)性化健康管理的趨勢,這意味著未來中國消費(fèi)級基因檢測市場廣闊。
 
學(xué)界對于基因與疾病的關(guān)系,更多還停留在關(guān)聯(lián)性研究的階段,而非確證性研究。相對于嚴(yán)肅醫(yī)學(xué)領(lǐng)域的基因檢測,消費(fèi)級基因檢測公司普遍面臨著基因檢測深度不夠高、規(guī)?;y、消費(fèi)者認(rèn)知不足的問題。尤其是目前國內(nèi)消費(fèi)級基因檢測主要服務(wù)是健康管理,健康管理則要將臨床數(shù)據(jù)、用戶的健康數(shù)據(jù)與基因數(shù)據(jù)結(jié)合起來。然而目前臨床數(shù)據(jù)和用戶的健康數(shù)據(jù)都比較薄弱,以及現(xiàn)在消費(fèi)基因檢測產(chǎn)品結(jié)果并無專業(yè)的醫(yī)療人員進(jìn)行診斷,在這種狀況下,即使基因數(shù)據(jù)量很大,也無法有效指導(dǎo)健康管理。
 
針對消費(fèi)級基因檢測行業(yè)整體大環(huán)境不容樂觀的情況下,已有多家企業(yè)做出戰(zhàn)略調(diào)整推動(dòng)消費(fèi)基因檢測智能化以提高基因檢測穩(wěn)定性和準(zhǔn)確性。
 
自動(dòng)化是智能化的基礎(chǔ),美因基因運(yùn)用自動(dòng)化水平的生產(chǎn)體系提高基因檢測水平,成為了中國首個(gè)及唯一一個(gè)日檢測能力超過5萬次的基因檢測平臺。而美因未來將進(jìn)一步結(jié)合基因技術(shù)和信息技術(shù),實(shí)現(xiàn)基因檢測高水平的自動(dòng)化和智能化,將更具性價(jià)比的產(chǎn)品和服務(wù)推向市場,推動(dòng)消費(fèi)級基因檢測的市場普及。

基因檢測智能化探索之非臨床應(yīng)用


基因信息學(xué)和藥物開發(fā)的交集也越來越多,不少藥企都開始成立自己的基因組學(xué)部門,來為新藥開發(fā)提供方向。如今我們所熟知的CD系列靶點(diǎn),很多都是誕生于這波浪潮之中?;蚪M學(xué)里測出來的數(shù)據(jù)都是海量級別,如何進(jìn)行清洗和利用,把它用到藥物開發(fā)中去,總歸離不開計(jì)算機(jī)和大數(shù)據(jù)技術(shù)。
 
對于靶向藥而言,生物標(biāo)志物(biomarker)舉足輕重,它與藥物敏感性、反應(yīng)率相關(guān)。傳統(tǒng)上,藥物開發(fā)者根據(jù)已有的知識尋找生物標(biāo)志物,常見的做法是將藥物靶點(diǎn)本身作為生物標(biāo)志物。這種模式直觀、并已有不少成功案例,但局限性也顯而易見。人類對自身和疾病的已有知識有限,絕大多數(shù)臨床試驗(yàn)實(shí)際上沒能用上生物標(biāo)志物,到三期失敗的臨床試驗(yàn)尤其如此。
 
實(shí)際上,肺癌明星藥易瑞沙初始的臨床三期也曾失敗,原研廠阿斯利康并沒有找到生物標(biāo)志物,而最終由哈佛大學(xué)的兩家試驗(yàn)室發(fā)現(xiàn)EGFR突變是易瑞沙的生物標(biāo)志物。
 

有分析認(rèn)為,基因信息規(guī)模最大的市場來自制藥公司藥品研發(fā)的臨床數(shù)據(jù)需求。2014年美國制藥公司的藥品研發(fā)總費(fèi)用為約1400億美元,只有3~4%用于購買臨床數(shù)據(jù),包括基因信息、用藥記錄、病歷等其他數(shù)據(jù)。盡管基因信息在現(xiàn)階段占藥品研發(fā)費(fèi)用比例較低,但預(yù)計(jì)未來幾年會(huì)逐步上升。


文章來源:動(dòng)脈網(wǎng)