今年年初,國產(chǎn)大模型DeepSeek橫空出世,并在醫(yī)療體系內(nèi)掀起了巨大聲浪。行業(yè)里幾乎每天都有不同醫(yī)院官宣接入DeepSeek大模型的消息發(fā)布,從最初的“全省首家”到后來的“全市80多家二級以上公立醫(yī)院全部接入”。據(jù)不完全統(tǒng)計,3個多月時間里,國內(nèi)已有上千家醫(yī)院完成DeepSeek大模型在院端的本地化部署。
在眾多醫(yī)院的官方報道中,院端接入DeepSeek大模型后,能夠全面提升傳統(tǒng)AI的能效,應(yīng)用場景主要集中在預(yù)問診、臨床輔助診斷、影像分析、個性化治療及院內(nèi)流程優(yōu)化等環(huán)節(jié)。比如上海華山醫(yī)院就曾披露稱,在DeepSeek深度融入醫(yī)院的核心信息系統(tǒng)后,高峰期患者的排隊時長減少了40分鐘,患者滿意度提升了近10個百分點。
但一段時間后,以DeepSeek為代表的大語言模型在醫(yī)院進行本地化部署的價值正在被重新評估。隨著DeepSeek大模型在醫(yī)院的不斷普及,困惑、失望甚至質(zhì)疑的聲音也逐漸多了起來。
在《健聞咨詢》的采訪中,很多醫(yī)院在實際使用中遇到了“模型用不起來,算力閑置,錯誤太多,臨床反饋不敢用”等問題。某頭部三甲醫(yī)院的信息科主任更是直言,為了接入DeepSeek,醫(yī)院光硬件就花了300萬元,但落地的效果遠遠低于預(yù)期。
有知情人士透露,許多醫(yī)院在算力配置上的經(jīng)費審批已經(jīng)縮減,“目前已經(jīng)進入了冷靜期”。
作為新一輪技術(shù)革命的底層構(gòu)造,大模型已經(jīng)在諸多領(lǐng)域自證價值。但對于醫(yī)院場景來說,大模型能在哪些關(guān)鍵環(huán)節(jié)提供幫助,能幫助到何種程度,仍然是一個未解的命題。
一、醫(yī)院紛紛嘗鮮,但臨床體感卻不佳
據(jù)了解,深圳大學(xué)附屬華南醫(yī)院是全國首個完成DeepSeek-R1本地化部署的醫(yī)院,時間是在今年2月7日前后,距離DeepSeek-R1模型發(fā)布的1月20日,僅僅過去了半個月。
在此之前,憑借ChatGPT的大熱,大模型在醫(yī)療行業(yè)已經(jīng)是一個被反復(fù)討論的技術(shù)概念。部分資源豐富的頭部醫(yī)院早已下場,和相關(guān)的技術(shù)廠商圍繞大模型的技術(shù)框架開展了一些有針對性的研發(fā)合作,比如將ChatGPT的對話能力用于互聯(lián)網(wǎng)醫(yī)院場景中的智能客服,減輕就醫(yī)導(dǎo)診的壓力。
對于醫(yī)院這樣一個極度講求效率的場所來說,大模型確實具有一定的適配性。最初級的幾個場景包括線上預(yù)問診、生成式電子病歷以及院外的患者隨訪管理等。這些場景的共同特點是,需要用到大量的自然語言,容錯率相對較高。再進一步看,當(dāng)大模型學(xué)習(xí)了足夠多的醫(yī)學(xué)知識和病患數(shù)據(jù)后,它將能夠在短時間內(nèi)處理復(fù)雜的臨床信息,為醫(yī)生提供決策支持。
但在DeepSeek問世前,醫(yī)院對于大模型還只停留在“感興趣”的階段,原因是,不同于其它使用者,醫(yī)院的信息流中充斥著大量的患者數(shù)據(jù),出于隱私保護和數(shù)據(jù)安全的考慮,這類數(shù)據(jù)只能在醫(yī)院內(nèi)網(wǎng)中運行。這也意味著,醫(yī)院不太可能通過第三方的云端服務(wù)來外部調(diào)用大模型的算力,如果想用,就必須在院內(nèi)安裝服務(wù)器,進行本地化部署。而早期的大模型非常消耗算力資源,想要在醫(yī)院這種高并發(fā)環(huán)境下順暢運行,光硬件配置都在數(shù)百萬到數(shù)千萬元不等。
DeepSeek的出現(xiàn)徹底改變了這個局面。通過混合專家架構(gòu) (MoE) ,DeepSeek不僅可以降低40%以上的算力消耗,還能在推理精度上保持競爭力,這一優(yōu)化使得醫(yī)院在本地化部署大模型成為可能?!跋啾扔贠penAI、Claude,在提供相似推理能力的前提下,DeepSeek的成本可以降到十分之一,甚至是二十分之一?!币晃粡氖箩t(yī)療信息化服務(wù)的資深人士表示。
多家醫(yī)院的采購公告顯示, 醫(yī)院本地化部署DeepSeek的預(yù)算大致在幾十萬元到一百萬元之間,其中70B和32B兩種參數(shù)模型最受青睞 。這也符合聯(lián)想醫(yī)療行業(yè)總監(jiān)姚宇軒對醫(yī)院不同層次匹配的模型參數(shù)的定義。他認(rèn)為,個人使用DeepSeek只要7B即可,科室級應(yīng)用不要超過70B,只有頭部醫(yī)院全流程應(yīng)用可以選671B滿血版,“但實際上我目前看到真正用到這么大模型的場景非常少,它更多還是支持小模型的并發(fā)。”
另一位行業(yè)人士宋坤 (化名) 則告訴《健聞咨詢》,給醫(yī)院做大模型的本地化部署,并沒有太高的門檻,傳統(tǒng)的醫(yī)療信息化服務(wù)公司都能做。據(jù)他所知,現(xiàn)在有不少互聯(lián)網(wǎng)醫(yī)療公司也盯上了這塊蛋糕,想來賺一筆塊錢,其中一家業(yè)務(wù)量比較大的,收費標(biāo)準(zhǔn)是每家醫(yī)院60萬元,目前已經(jīng)做了幾十家,收入在短時間內(nèi)就達到了千萬元級。
“大部分所謂的本地化部署,就是在醫(yī)院的HIS系統(tǒng)里開一個界面,讓你可以和DeepSeek對話,完成查詢檢索的基本功能,這個和我們遠程打開網(wǎng)頁調(diào)用DeepSeek,在使用上沒有任何區(qū)別?!彼卫け硎?,唯一的區(qū)別只是,通過私域服務(wù)器,醫(yī)院內(nèi)網(wǎng)的數(shù)據(jù)既不會公開,也不會被大模型公司收走。
這個說法也在東部沿海某頭部三甲醫(yī)院的信息科主任金浩 (化名) 那兒得到了應(yīng)證。金浩表示,為了彰顯醫(yī)院的決心和地位,他們在幾個月前就上了671B的滿血版DeepSeek,光H100顯卡就花了300萬元,但試用下來,效果相當(dāng)拉跨,“ 最大的問題就是錯誤一堆,醫(yī)生不敢用,現(xiàn)在主要是用于寫一些行政文件 。”
采訪中,另一家南方三甲醫(yī)院的信息科主任也表示,DeepSeek部署完成后,他們上的第一個應(yīng)用是行政總值小助手,第二個應(yīng)用是科研小助手,這兩個應(yīng)用的價值主要體現(xiàn)在醫(yī)院的內(nèi)部管理,和臨床科室并沒有太大關(guān)系。
二、尋求最佳落地場景
對于醫(yī)院來說,理想的狀況是,引入大模型這樣的底層技術(shù)后,可以全面賦能院內(nèi)的信息化系統(tǒng),提升整體工作效率。
但事實上,這個設(shè)想基本不可能落地。主要原因在于,每家醫(yī)院內(nèi)部都有幾十甚至上百個信息化系統(tǒng),僅僅是讓DeepSeek和這些系統(tǒng)逐個完成對接,就需要耗費極大的資源和人力。更大的問題在于,即便對接上了,這些系統(tǒng)中還存有大量非標(biāo)準(zhǔn)化的、質(zhì)量參差不齊的數(shù)據(jù),對這些數(shù)據(jù)進行清洗治理又是一個耗時巨大的工程。
而對于醫(yī)院的管理者來說,對信息系統(tǒng)進行如此大范圍的改造升級,本來就要承擔(dān)風(fēng)險。風(fēng)險之一是,如果要動原來的系統(tǒng),那就有可能在改造期間給醫(yī)院運行帶來未知的麻煩,一旦出了問題,誰來承擔(dān)責(zé)任。風(fēng)險之二是,新系統(tǒng)做出來了,它是不是真的能比原來更好用,或者說好用多少,這一點大家并沒有共識。
“ 所以大多數(shù)時候,醫(yī)院部署完大模型后,就放在那兒了。 ”宋坤表示,據(jù)他的估算,這類現(xiàn)象在所有宣稱完成大模型部署的醫(yī)院中,出現(xiàn)得比較普遍。
另一個導(dǎo)致大模型在醫(yī)院臨床環(huán)節(jié)應(yīng)用受阻的核心矛盾,在于大模型本身。大模型的技術(shù)底層是基于統(tǒng)計學(xué)習(xí)的概率響應(yīng),本質(zhì)上來說,它并不能理解知識,只是根據(jù)某種概率原則,將互聯(lián)網(wǎng)上的信息重新組合拼接,再轉(zhuǎn)化成自然語言反饋出來。而互聯(lián)網(wǎng)上的信息大多數(shù)是沒有經(jīng)過對錯定義的,這就導(dǎo)致了大模型會出現(xiàn)幻覺。
“這種錯誤在其它地方還好,在醫(yī)院里頭是要出大問題的?!苯鸷聘嬖V《健聞咨詢》,他們早期讓臨床醫(yī)生試用過,后來發(fā)現(xiàn)大模型響應(yīng)回來的東西存在很多問題,導(dǎo)致后來醫(yī)生這一端根本用不起來,“就是你本來自己做,2分鐘就做完了,現(xiàn)在大模型搞出來,你還得花5分鐘去校驗、修改,那就沒意義了嘛?!?/p>
針對大模型的這一弊端,金浩認(rèn)為,最關(guān)鍵的還是要在后期做微調(diào),要保證喂給它的語料,都是判定為對的知識,這樣才能提升大模型在醫(yī)學(xué)領(lǐng)域的專業(yè)程度。而這部分工作,既非預(yù)裝醫(yī)療應(yīng)用的一體機可以解決,也不是醫(yī)療信息化公司能夠獨立交付的,它需要臨床醫(yī)生和技術(shù)專家在一個漫長的周期里高頻地溝通、碰撞、合作才有可能實現(xiàn)。
從投資回報的角度看,這顯然不是一筆劃算的買賣,但國內(nèi)的一些頭部醫(yī)院已經(jīng)開始了類似的探索。
上海仁濟醫(yī)院和螞蟻集團合作,花一年多時間構(gòu)建了國內(nèi)首個臨床??仆评頂?shù)據(jù)集,這個針對泌尿外科的數(shù)據(jù)集包含了2132個問答對,對應(yīng)25000多條診療依據(jù)和臨床數(shù)據(jù),每一條數(shù)據(jù)都經(jīng)過仁濟醫(yī)院泌尿外科醫(yī)生的確認(rèn)。在高質(zhì)量的語料喂養(yǎng)下,仁濟醫(yī)院的泌尿外科大模型的診斷準(zhǔn)確率為69.81%,接近??漆t(yī)生的水平。
此外,上海瑞金醫(yī)院也攜手華為,在年初發(fā)布了瑞智病理大模型RuiPath。據(jù)了解,瑞金醫(yī)院從2021年就開始建設(shè)數(shù)字化智慧病理科,此次RuiPath的核心語料正是來自于瑞金醫(yī)院病理科積累的百萬級數(shù)字病理切片庫。在由病理醫(yī)生整理的常用問題測試中,RuiPath表現(xiàn)不俗,回答準(zhǔn)確率在90%以上。
根據(jù)動脈網(wǎng)的統(tǒng)計,目前國內(nèi)已經(jīng)發(fā)布了22個專病專科垂直模型,這些模型均由頂級三甲醫(yī)院主導(dǎo)研發(fā),比如北京協(xié)和醫(yī)院研發(fā)的罕見病大模型“協(xié)和·太初”、上海復(fù)旦大學(xué)附屬中山醫(yī)院的心血管專科大模型“觀心”、華西醫(yī)院的骨科大模型平臺“DeepJoint”、山東齊魯醫(yī)院的急性胸痛大模型“齊魯·心擎”等。
“大模型在醫(yī)療場景的落地,最終還是要直面臨床痛點,遵循客觀規(guī)律,專病??拼竽P褪悄壳皹I(yè)內(nèi)認(rèn)可度最高的方向之一?!彼卫け硎?,這類大模型雖然在前期會花費比較多的資源和代價,但一旦在臨床端獲得認(rèn)可,就能創(chuàng)造巨大的經(jīng)濟價值和社會效益,“尤其是在分級診療的大方向下,未來所有基層醫(yī)療機構(gòu)都會是它們的潛在客戶?!?/p>
但至少在當(dāng)下,對于爭相部署大模型的醫(yī)院來說,期待中的價值還遠沒有兌現(xiàn)。