500億入場費,科技巨頭為了進入醫(yī)療究竟有多卷?

以下文章來源于:動脈網(wǎng)

“嶄新的計算平臺已經誕生,AI的‘iPhone時刻’已經到來,加速計算和AI技術已經走進現(xiàn)實,”在3月21日GTC 2023春季大會的開場演講中,春風得意的英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛這樣總結近來AI技術的突破——在本次GTC上,與生成式AI相關的主題會議超過了70場。


這一看法并不夸張。一天前,微軟和Nuance發(fā)布一款讓醫(yī)生臨床記錄“iPhone化”的殺手級AI應用,也是醫(yī)療行業(yè)第一款結合GPT4模型的應用,距離GPT-4發(fā)布不到一周時間。微軟在此前投給OpenAI創(chuàng)紀錄的100億美元看起來非常超值,不僅創(chuàng)造了微軟在醫(yī)療領域的高光時刻,也代表了科技巨頭在醫(yī)療領域持續(xù)加碼的大潮。


在GPT-4發(fā)布的前一日,谷歌剛剛拿出了專門針對醫(yī)療的生成式AI模型。雖然比爆火的ChatGPT來得晚了一些,但生成式AI在醫(yī)療上有著充分的發(fā)揮空間,這場馬拉松比拼的不是誰先起跑,而是誰能堅持到最后。


已經入局的科技巨頭正在持續(xù)深耕,還未進入的則在抓住每一個潛在的機會入局。對此,半導體巨頭AMD也直呼“Yes”。畢竟它幾十年來首次將自己的箭頭標志刻印到了醫(yī)療領域。


科技巨頭在醫(yī)療的加碼內卷,會帶給我們什么?值得期待。


  微軟巨資收購Nuance,

GPT-4加持醫(yī)療后發(fā)制人


微軟進入醫(yī)療的時間其實很早,早在1999年就投資了醫(yī)療信息網(wǎng)站W(wǎng)ebMD。此后數(shù)年,微軟也陸續(xù)收購了一些醫(yī)療相關企業(yè)。但彼時微軟并未將醫(yī)療當作主要業(yè)務,也未對這些業(yè)務進行整合。


2017年,微軟啟動了Healthcare NExT,開始系統(tǒng)性進軍醫(yī)療。這一次微軟將方向指向當時方興未艾的醫(yī)療AI,希望利用微軟在AI和云計算方面的優(yōu)勢推動醫(yī)療創(chuàng)新,主要目的包括減輕醫(yī)生的數(shù)據(jù)錄入負擔、分流病人及監(jiān)督病人院外護理。


在此后幾年,微軟在醫(yī)療領域基本延續(xù)了這一方向。并在2020年推出了微軟第一個專門針對醫(yī)療行業(yè)的云計算解決方案——Microsoft Cloud for Healthcare。


不過,坦白而言,擁有這些業(yè)務的微軟在醫(yī)療領域的名氣并沒有后來被收購的Nuance大。Nuance曾是語音AI領域的領導者,不僅是蘋果Siri語音引擎的開發(fā)者,更曾經在全球智能語音市場中占據(jù)六成以上的市場份額。在受到科技巨頭的挑戰(zhàn)后,Nuance將業(yè)務重心轉向醫(yī)療領域,并通過數(shù)年深耕建立了很高的競爭壁壘。


2021年4月,微軟宣布以197億美元巨資收購Nuance。這筆交易是微軟成立迄今第三大收購案,極大地加強了微軟在醫(yī)療垂直領域的影響力。


Nuance的服務已經被嵌入微軟醫(yī)療云,可以為醫(yī)生提供語音識別和轉錄服務。語音AI能夠智能識別醫(yī)生與患者的對話內容,并進行語境分析,隨后將數(shù)據(jù)輸入到電子病歷中自動創(chuàng)建臨床記錄,以提升醫(yī)生診斷的有效率。


微信圖片_20230327152244.jpg

Nuance的DAX可通過語音生成臨床記錄(圖片來自Nuance官網(wǎng))


GPT模型的加入將大幅度提升臨床記錄的生成時間。一般而言,未引入GPT-4模型的DAX生成臨床記錄需要約四個小時左右。依靠GPT-4強大的生成式大語言模型和推理能力,DAX Express將這個過程縮短到僅僅幾秒鐘。


這極大地改善醫(yī)生的使用體驗,減少其處理文書工作的負擔,使得無延時的臨床記錄成為可能,并提升了效率。


對于微軟來說,率先引入GPT-4將使其在醫(yī)療領域的影響力有極大提升——現(xiàn)在知道微軟也在深耕醫(yī)療的人比以往顯然要多出幾個數(shù)量級。


這種搶先并不難理解。微軟過往幾年持續(xù)投資OpenAI,并在1月底追加了據(jù)說100億美元的投資;還為其提供Azure云服務;甚至還專門為OpenAI打造了一臺超級計算機,用來在Azure公有云上訓練GPT-3。能夠滿足這種訓練所需海量算力的商業(yè)實體,在全球也屈指可數(shù)。


相比ChatGPT背后所使用的GPT-3.5,GPT-4的解答能力及正確率都有大幅提升。GPT-4.0在美國SAT考試獲得了163分(滿分180分)的高分,超越了88%考生的成績。同時,它在律師資格考試中也超過了90%的考生,相比之下,GPT-3.5只有倒數(shù)10%的水平。


不過,大眾在使用ChatGPT的過程中也發(fā)現(xiàn),生成式AI仍然存在一些問題,尤其是“一本正經的胡說八道”可能會制造相當多的認知偏差和虛假信息。畢竟這項技術的本質是通過概率最大化不斷生成數(shù)據(jù),而不是完全通過邏輯推理對問題進行解答的算法模型。此外,由于生成式AI具有一定的自主性,數(shù)據(jù)安全和隱私泄露也被認為是一大隱患。


無論如何,在這場科技大佬加碼醫(yī)療的競爭中,微軟的提速已使它領先了半個身位。


  多年探索醫(yī)療叫好不叫座,

谷歌的調整需要時間


就在微軟攜GPT殺入醫(yī)療領域的前一天,谷歌剛剛召開了“The Check Up with Google Health”年度活動,以展示其在醫(yī)療領域的最新發(fā)展。醫(yī)療AI則是其中的重點。


在ChatGPT走紅之前,谷歌一直被認為是AI領域的頂流。DeepMind和AlphaFold在彼時的熱度絲毫不比OpenAI和ChatGPT現(xiàn)有的熱度差。在去年ChatGPT發(fā)布后短短幾周,谷歌便和DeepMind拿出了Med-PaLM。


這是一個專門針對醫(yī)療健康領域的大型語言模型——在過去幾年,谷歌一直在進行醫(yī)學大型語言模型的研究,以應對醫(yī)療領域所需的專業(yè)性和特殊性。


Med-PaLM模型取得了不俗的成績。它是第一個在美國醫(yī)療許可類問題上獲得“及格分數(shù)”(>60%)的AI,不僅準確地回答了多項選擇題和開放式問題,還提供回答理由并對自己的回答進行評估。


在本次活動上,谷歌展示了Med-PaLM 2。據(jù)谷歌介紹,新版本模型的表現(xiàn)比之前提高了18%,遠超過其他同類的人工智能模型(當然,彼時GPT-4還未發(fā)布)。在醫(yī)學考試中,Med-PaLM 2的表現(xiàn)已經基本接近“專家”醫(yī)生的水平,得分達到了85%


不過,谷歌也坦承這些進步雖然可喜,但距離在真實環(huán)境中部署仍有不小的距離。來自不同背景和國家的臨床醫(yī)生和非臨床醫(yī)生根據(jù)14項標準(包括科學真實性、精確性、醫(yī)學共識、推理、偏見和傷害等)對模型進行了評估。谷歌團隊發(fā)現(xiàn)Med-PaLM 2在回答醫(yī)療問題和滿足谷歌對產品卓越標準方面還有一些距離。未來,谷歌也將會持續(xù)與研究人員和全球醫(yī)學界合作,希望能夠讓這項技術真正幫助改善醫(yī)療服務。


雖然Med-PaLM 2暫時不能投入實用,但谷歌在影像AI上倒是取得了不少進展。在去年10月,Google Health與iCAD達成協(xié)議,將谷歌的乳腺影像AI技術整合到其乳腺影像產品中。這也是谷歌首次將其乳腺成像AI模型部署到臨床實踐


在本次活動上,谷歌也宣布將進一步加強超聲AI模型的構建,用于孕產婦護理及乳腺癌早篩等,從而幫助解決全球超聲影像醫(yī)生普遍缺乏及超聲檢查質量參差不齊的痛點。


同時,谷歌也在和妙佑醫(yī)療國際合作,利用AI輔助放療規(guī)劃。此外,谷歌還將在非洲推動AI輔助早篩結核病——根據(jù)統(tǒng)計,全球超過25%的結核病死亡發(fā)生在非洲。


谷歌在醫(yī)療上的進展雖然看起來熱鬧,但與同期微軟的亮眼表現(xiàn)相比,就有點“沒有對比就沒有傷害”的意味了。


事實上,谷歌近年來在醫(yī)療領域的探索并不如意。2021年,這家科技巨頭的業(yè)務業(yè)務迎來巨震——谷歌宣布改變其醫(yī)療保健戰(zhàn)略,解散了曾經獨立的Google Health,其人員也被融入到現(xiàn)有的其他業(yè)務線。


商業(yè)化一直以來是谷歌在醫(yī)療健康領域面臨的難題。在谷歌的年報中,Other Bets業(yè)務指不同發(fā)展階段的新興業(yè)務,包涵了醫(yī)療及互聯(lián)網(wǎng)服務等業(yè)務。這一業(yè)務單元的收入長期沒有什么長進,一直維持在6-7億美元左右;其虧損倒是逐年增加,2021年已經達到了53億美元之多。


組織架構導致業(yè)務重疊或許也是谷歌近來在醫(yī)療領域表現(xiàn)一般的原因。從2015年谷歌改組為Alphabet開始,各條醫(yī)療健康產品線逐漸聚合和獨立的業(yè)務單元。到了2021年初,谷歌的醫(yī)療健康業(yè)務大致可以分為Google Health、Verily和Calico三個單元。這些單元的業(yè)務之間長期存在交叉重疊,使得原本就不順暢的商業(yè)化更加雪上加霜。


在如今的新架構下,谷歌能不能在醫(yī)療領域上找到感覺還需要進一步驗證。但它的例子也說明醫(yī)療領域的特殊性——即使是戰(zhàn)無不勝的科技巨頭,也很難玩得轉。


致力打造醫(yī)療AI基座的

英偉達,正迎來人生巔峰


如今火遍全網(wǎng)的GPT是大型語言構建模型的一種,所謂“大型”,從近幾年GPT模型的規(guī)模變化上可見一斑。2018年發(fā)布的初代GPT參數(shù)量只有1.17億,預訓練數(shù)據(jù)量僅有5GB。GPT-3的參數(shù)量則已經暴增到1750億,預訓練數(shù)據(jù)量更是達到了45TB(1TB=1024GB)。


已經亮相的GPT-4并未公布相應的指標,但以OpenAI的風格,以及大幅優(yōu)于上一代的表現(xiàn)來看,模型規(guī)模大概率會高出不少。這需要巨大的算力才能完成模型訓練和推理,且成本極為高昂。


根據(jù)媒體報道,微軟為OpenAI模型訓練打造的超級計算機擁有28.5萬個CPU核心及超過1萬顆在當時尚屬頂級的V100 GPU——即使將V100更換為目前主流的A100,仍然需要3000顆的規(guī)模。


此外,GPT3一次訓練的花費超過460萬美元,相應的云資源成本一年下來也要近億美元。整個2022年,OpenAI在GPT-3的訓練上花費超過5億美元。全世界也沒有幾家企業(yè)有這樣的財力應付這樣一個暫時無法產生任何收入的“吞金獸”。這也是之前這類大型語言模型未能流行的重要原因。


隨著生成式AI逐漸獲得認可,對于算力的需求正在急劇膨脹。據(jù)OpenAI測算,自2012年以來,全球頭部AI模型訓練算力需求幾乎每3-4個月就翻一番,每年頭部訓練模型所需算力的增長幅度高達10倍。


對于AI基礎算力提供者的英偉達而言,沒有比這更好的消息了。在ChatGPT引發(fā)的生成式AI熱潮下,英偉達的股價自年初以來已經上漲近八成,達到了271.91美元(3月23日),市值逼近6500億美元,一舉超過特斯拉。


微信圖片_20230327152252.jpg

英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,AI的“iPhone”時刻已經到來(截圖自視頻直播)


在近日召開的2023年春季GTC大會中,與生成式AI相關的主題會議超過了70場。同時,英偉達火速拿出了專門針對生成式AI的H100 NVL GPU。雖然未能來得及打造全新的架構,但通過將兩顆目前頂級的H100GPU拼接,仍然可以將算力提升2-3倍。


英偉達和日本頭部商業(yè)財團三井物產合作研發(fā)Tokyo-1超級計算機,以利用生成式AI為日本制藥行業(yè)和初創(chuàng)企業(yè)的藥物研發(fā)賦能。包括安斯泰來制藥、第一三共制藥和小野制藥等日本藥企頂流都已計劃應用這一超級計算機。


同時,英偉達還推出了NVIDIA AI Foudations云服務,以幫助需要構建、完善和運行自定義大型語言模型及生成式AI的客戶加速生成式AI的引入。這一服務包括用于自然語言處理的Nemo、圖像處理的Picasso,以及針對制藥業(yè)的BioNeMo。


其中,BioNeMo可以加速加速藥物研發(fā)過程中最耗時、費用最高的階段。它可提供預訓練模型,并使用專有數(shù)據(jù)自定義服務于藥物研發(fā)流程各階段的模型——其中就包括生成式AI,如幫助研究人員設計特有蛋白質的ProtGPT-2。


通過這些模型,BioNeMo可以幫助研究人員識別正確的靶向目標、設計分子和蛋白質并預測它們在人體內的相互作用,從而研發(fā)出最佳候選藥物。


生成式AI模型能夠快速識別潛在的藥物分子,在某些情況下甚至可從零開始設計出化合物或基于蛋白質的治療藥物。這些模型在小分子、蛋白質、DNA和RNA序列的大型數(shù)據(jù)集上進行訓練后,可以預測蛋白質的3D結構和分子與目標蛋白質對接的程度。


目前,已有不少藥企嘗試使用生成式AI設計新的候選藥物。安進(Amgen)就使用了BioNeMo來加快其生物制劑的研發(fā)流程,來探索和研發(fā)出新一代藥物中的治療性蛋白質。


除了藥物發(fā)現(xiàn)外,生成式AI在藥物設計、劑量選擇等藥物開發(fā)環(huán)節(jié)中也可提高效率并完善治療效果。預計到2040年,生成式AI可能會為醫(yī)療行業(yè)帶來1萬億美元的價值。


通過多年的持續(xù)加碼,英偉達在醫(yī)療領域已經成功構建了一個龐大的AI底座,并與醫(yī)療生態(tài)互為賦能。一方面,通過硬件升級持續(xù)提供基礎算力,并加入軟件及服務幫助客戶快速導入應用,英偉達正持續(xù)挖掘醫(yī)療AI這一肉眼可見的巨大“金礦”。另一方面,醫(yī)療AI也通過英偉達軟硬件的加持獲得了巨大的提升,從而在更多的場景發(fā)揮更大的作用。


500億豪賭讓AMD

  在醫(yī)療也可以Yes!


2022年,在進軍醫(yī)療領域的科技巨頭上又多了一個響當當?shù)拿?,這便是AMD。作為英特爾和英偉達的老對手,AMD同樣也是基礎AI算力的提供者。不過,一直以來,它都沒有在具體業(yè)務中嘗試醫(yī)療領域。


2020年10月,AMD宣布以350億美元收購FPGA巨頭賽靈思(Xilinx)。由于賽靈思是FPGA第一大廠(2020年其市占率高達49%),這起收購引發(fā)了各國曠日持久的反壟斷審查,直至2022年才正式完成。隨著在此期間賽靈思的股價上漲,并購規(guī)模也達到了近500億美元,創(chuàng)造了半導體產業(yè)并購重組的新紀錄


深耕FPGA的賽靈思數(shù)十年來在醫(yī)療、航空航天、汽車、國防等行業(yè)積累了諸多客戶資源,對新AMD價值連城,也為其贏得了包括醫(yī)療在內諸多高壁壘細分市場的“入場門票”。


FPGA在醫(yī)療成像領域早已得到廣泛應用。全球主要醫(yī)療器械廠商都在大量使用FPGA。其應用范圍主要有超聲成像、3D渲染、X射線的數(shù)據(jù)采集、核磁共振成像接口等。此外,在內窺鏡或者是除顫器、病人監(jiān)護儀中也可以看到FPGA的蹤影。在這些應用中,F(xiàn)PGA可以提供比DSP更強的運算能力,讓成像過程中的一些算法得到高速執(zhí)行。


作為FPGA領域的領導者,賽靈思在這些應用上早已有多年深耕。借由收購賽靈思,AMD也得以首次把自己的“箭頭”標志刻印到醫(yī)療領域


微信圖片_20230327152333.jpg

AMD通過收購進入到醫(yī)療領域(截圖自活動海報)


2023年初的CES展會上,AMD發(fā)布其首個用于Vitis 2022.2統(tǒng)一軟件環(huán)境的醫(yī)學成像庫(Medical Imaging Library),以提供更好的超聲成像質量——目前,繼續(xù)提升超聲成像質量和成像精準性正面臨越來越大的挑戰(zhàn)。


AMD的醫(yī)學成像庫可極大地提升成像質量并降低延時。通過為賽靈思的FPGA芯片硬件部署超高性能的超聲波束成形算法,超聲設備即使在難以掃描的腹部或心臟部位,也將可以獲得以低延時高質量的成像效果。


此外,這一醫(yī)學庫還采用了三級庫設計,從第1級的模塊構建到第3級的完整超聲波束成形器設計一應俱全,這將為設備廠商提供豐富的選項,從而幫助他們縮短開發(fā)時間,將產品更快推向市場。


坦白而言,AMD目前在醫(yī)療領域的應用場景還較為單一,但未來可期。這是因為配合專用算法的FPGA因其較為靈活的可配置特性和特定環(huán)境不遜于GPU的性能可以成為AI公司的另外一個選擇。


比如,在輔助病情診斷(慢性病篩查和風險評估)等場景,通過學習過往慢性病患者數(shù)據(jù)可以預測未來患病風險。這類場景使用FPGA也可實現(xiàn)模型訓練、推理性能的提升。


再加上既有的CPU和GPU產品線,AMD在醫(yī)療領域還有很大的潛力可以挖掘。


科技巨頭為何

紛紛進軍醫(yī)療,難點何在?


科技巨頭紛紛加碼醫(yī)療領域并不奇怪。首先,醫(yī)療市場的規(guī)模實在可觀。根據(jù)統(tǒng)計,美國醫(yī)療市場規(guī)模在2021年達到4.09萬億美元。這個數(shù)字包括醫(yī)療保健設施和服務、制藥、醫(yī)療器械和產品、以及醫(yī)療保險等多個領域的支出,還沒有包括與醫(yī)療相關的研究和發(fā)展支出。


同時,醫(yī)療領域的支出往往都是剛需支出。這并不難理解——畢竟,砸鍋賣鐵治病并不少見,但砸鍋賣鐵僅僅只是為了一時的享受實在罕見。正因為此,當經濟下行時,消費科技領域受到的沖擊遠遠大于醫(yī)療領域。很不幸的是,這就是目前發(fā)生的情況——根據(jù)世界銀行的研究報告,目前全球經濟正處于1970年以來最嚴重的下滑。


盡管如此,科技巨頭多年來在醫(yī)療領域的表現(xiàn)能夠對得起其投入的實在是鳳毛麟角。動脈網(wǎng)認為,科技巨頭在醫(yī)療健康領域表現(xiàn)不佳,通常來說有幾個原因。


基于其屬性,科技巨頭進軍醫(yī)療健康領域往往選擇自身技術優(yōu)勢的延伸,以技術創(chuàng)新的方式入手。這種創(chuàng)新一旦成功必然建立起牢固的優(yōu)勢,比如英偉達基于GPU在AI加速上取得的巨大成功。遺憾的是,技術創(chuàng)新的失敗率非常之高,往往需要多次的嘗試。


科技巨頭在進入醫(yī)療后會發(fā)現(xiàn)行業(yè)環(huán)境發(fā)生了巨大的改變,患者隱私保護、數(shù)據(jù)收集標準在以往或許并不是個大問題,但在強監(jiān)管的醫(yī)療健康領域往往成為巨大障礙。以往通過數(shù)據(jù)驅動的方式很難解決醫(yī)療保健中最復雜的事情。


由于之前的成果,科技巨頭往往會迷信以往的成果,天真地以為技術可以解決醫(yī)療領域的所有問題。遺憾的是,對于患者而言,問題更多的是整體體驗,而不是技術本身。事實上,人們在醫(yī)療問題上往往偏于保守,寧愿選擇經過驗證、成熟穩(wěn)妥的方案,新技術的應用推廣往往需要相當長時間的蟄伏期。


與專注于醫(yī)療健康的科技公司不同,難以盈利的醫(yī)療健康業(yè)務在科技巨頭中只能獲得少數(shù)公司資源,也沒有連貫的企業(yè)級戰(zhàn)略,很難將分散于各部門的零散醫(yī)療業(yè)務聚集起來形成合力。對于醫(yī)療的長期投入也缺乏心理準備,業(yè)務部門的策略不得不經常變動,難以持續(xù)。這在需要長期穩(wěn)定投入和高度耐心的醫(yī)療領域是行不通的


如何將自身的優(yōu)勢與醫(yī)療的特點相結合,從而在醫(yī)療領域實現(xiàn)破局,真正在醫(yī)療領域“叫好又叫座”。對于已經或者想要進軍醫(yī)療領域的科技巨頭來說,都將是一個值得深思的問題。


我們期待科技巨頭們能夠更好地介入醫(yī)療領域,從而為推動醫(yī)療行業(yè)的數(shù)字化轉型和智能化升級做出更多貢獻。