12月16日,中文醫(yī)療大模型權威評測平臺MedBench4.0發(fā)布最新評測結(jié)果。云知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展現(xiàn)出全面領先的技術實力,一舉斬獲醫(yī)療智能體、醫(yī)療大語言模型、醫(yī)療多模態(tài)大模型三項技術范式,成為本次評測中表現(xiàn)最為突出的“三冠王”。

其中,UniGPT?Med?U1在醫(yī)療大語言模型評測中以綜合得分65.7分登頂,力壓Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一眾國際頂尖模型。同時,在醫(yī)療智能體評測中以綜合得分94.6分的優(yōu)異成績,大幅領先第二名Claude-Sonnet-4.5(88.8)近6分;

MedBench4.0-醫(yī)療大語言模型評測榜單

MedBench4.0-醫(yī)療智能體評測榜單
UniGPT?Med?VL則在醫(yī)療多模態(tài)大模型評測中以綜合得分59.6分摘得桂冠,領先第二名GPT-5(53.7分)近6分,展現(xiàn)出絕對技術優(yōu)勢。

MedBench4.0-醫(yī)療多模態(tài)大模型評測榜單
MedBench評測平臺由上海人工智能實驗室、上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合多家權威機構共同打造,以其科學、公平、嚴謹?shù)脑u測體系著稱。2025年11月20日,該平臺全面迭代更新至4.0版本,成為全國首個且唯一面向垂直模型、專用模型及各應用場景的醫(yī)療大模型評測與驗證體系。本次升級聚焦實戰(zhàn)化評測突破與生態(tài)化開放共建兩大核心,全面覆蓋醫(yī)療大語言模型、醫(yī)療多模態(tài)大模型及醫(yī)療智能體三大技術范式,并深度對齊國家《衛(wèi)生健康行業(yè)人工智能應用場景參考指引》,旨在為醫(yī)療AI從技術可行走向臨床可用搭建關鍵的驗證橋梁。
基于嚴格的醫(yī)學標準,平臺構建了高質(zhì)量、多維度、覆蓋廣泛的評測集。其中,醫(yī)療大語言模型評測涵蓋5大能力維度、36個專業(yè)子集,約70萬條數(shù)據(jù);醫(yī)療多模態(tài)大模型評測聚焦3大核心能力、10個專業(yè)子集;醫(yī)療智能體評測則圍繞6大行動維度設置了14個復雜任務集。在此嚴苛且全面的評估框架下,山海大模型能夠一舉奪得三項冠軍,充分彰顯了其極高的技術含金量與實用價值。
此次評測的卓越表現(xiàn),得益于山海醫(yī)療大模型最新版本完成的系統(tǒng)性核心升級。新版本致力于構建業(yè)界能力維度最豐富的醫(yī)療AI技術支撐體系,其核心亮點在于實現(xiàn)了“醫(yī)學文本大模型”與“醫(yī)學多模態(tài)大模型”雙核心產(chǎn)品體系的深度融合,全面覆蓋從文本處理、智能體協(xié)同到影像解析的多元功能,形成了當前能力維度最豐富的醫(yī)療AI技術架構。
通過深度融合模擬臨床思維的復雜推理能力,模型實現(xiàn)了精準的鑒別診斷與循證決策支持;同時,原生內(nèi)化的任務規(guī)劃、工具調(diào)用與多智能體協(xié)作等核心能力,推動其完成了從“醫(yī)學認知大腦”向“自主醫(yī)療行動者”的關鍵進階,能夠高效適配并執(zhí)行復雜的真實醫(yī)療任務流程。
在多模態(tài)能力方面,新版本展現(xiàn)出對臨床場景的深度賦能。它不僅能夠精準識別X光、CT、MRI等多種醫(yī)學影像中的病灶與解剖結(jié)構,高效提取醫(yī)療文檔關鍵文本信息,更支持跨模態(tài)語義對齊與聯(lián)合推理,能夠融合影像特征與臨床描述進行綜合判斷,為臨床決策提供多源數(shù)據(jù)支撐的精準建議。
權威榜單的成績是技術實力的顯性證明,而真正的價值在于臨床實踐的檢驗與認可。依托該模型,云知聲推出了覆蓋診療全流程的“智慧醫(yī)療產(chǎn)品矩陣”,涵蓋智能病歷生成與質(zhì)控、臨床輔助決策、醫(yī)療質(zhì)量監(jiān)管、醫(yī)保支付智能審核以及智慧患者服務等核心產(chǎn)品。這些產(chǎn)品已深入醫(yī)政管理、臨床診療、運營管理和患者服務等關鍵環(huán)節(jié),并在全國部署近400家醫(yī)院,700余家醫(yī)院進入測試階段。其中覆蓋北京協(xié)和醫(yī)院、北京友誼醫(yī)院、東南大學附屬中大醫(yī)院、青島大學附屬醫(yī)院等數(shù)百家國內(nèi)頂級三甲醫(yī)院。
在提升診療效率與質(zhì)量方面,落地案例成效顯著。例如,門診病歷生成系統(tǒng)能夠?qū)崟r捕捉醫(yī)患之間的對話內(nèi)容,智能提取關鍵問診信息,并自動生成結(jié)構化病歷。醫(yī)生僅需進行簡單審核,即可完成病歷書寫工作。目前該系統(tǒng)已在北京友誼醫(yī)院順義院區(qū)廣泛應用,單份病歷直接引用率接近90%,大幅降低了醫(yī)生文書負擔;智能病歷質(zhì)控系統(tǒng)能夠精準理解病歷內(nèi)容,并智能識別其中的書寫錯誤與缺陷。系統(tǒng)對影像描述、專業(yè)術語進行細致分析,并對檢查結(jié)果、檢查結(jié)論以及檢查依據(jù)進行深度解讀,從而實現(xiàn)高效、精準的病歷質(zhì)控;DRG/DIP醫(yī)保支付管理系統(tǒng)以智能提醒和數(shù)據(jù)分析兩種方式,從診療過程中、醫(yī)保結(jié)算前到醫(yī)保結(jié)算后,為醫(yī)生、質(zhì)控員、編碼員和醫(yī)保處提供全流程、全方位的醫(yī)保支付管理服務。該系統(tǒng)成功助力中國人保財險完成核賠風控AI醫(yī)療審核系統(tǒng)的全國性部署。
作為AGI技術的先行者,云知聲始終致力于以專業(yè)大模型和全棧自研AI技術解決產(chǎn)業(yè)核心問題。山海醫(yī)療大模型在三大核心評測維度的全能奪冠,標志著其技術體系實現(xiàn)了從底層認知、多模態(tài)理解到上層智能體執(zhí)行的全棧式、一體化突破,為醫(yī)療AI的深度臨床應用樹立了新的標桿。
未來,云知聲將繼續(xù)深耕醫(yī)療AI領域,持續(xù)推動更加安全、可靠、智慧的醫(yī)療AI解決方案在廣泛場景中落地應用,賦能醫(yī)療服務體系的質(zhì)量與效率升級,為助力健康中國建設貢獻堅實的科技力量。
-
醫(yī)療
+關注
關注
8文章
1999瀏覽量
61579 -
云知聲
+關注
關注
0文章
314瀏覽量
9360 -
大模型
+關注
關注
2文章
3645瀏覽量
5176
原文標題:云知聲山海醫(yī)療大模型問鼎MedBench4.0三項榜首,以“三冠王”戰(zhàn)績樹立醫(yī)療AI新標桿
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
云知聲正式推出Unisound U1-OCR文檔智能基礎大模型
云知聲發(fā)布“山海·知音”大模型2.0,醫(yī)療AI加速落地驅(qū)動業(yè)績高增長
云知聲山海醫(yī)療大模型問鼎MedBench4.0三項榜首
評論