時隔許久,王小川創(chuàng)立的百川智能公布最新模型技術(shù)進(jìn)展。
8月11日消息,百川智能今天發(fā)布一款開源的醫(yī)療增強大模型Baichuan-M2。
具體來說,針對醫(yī)療領(lǐng)域用戶隱私考慮下的模型私有化部署需求,百川智能對Baichuan-M2進(jìn)行了極致輕量化,量化后的模型精度接近無損,可以在RTX4090上單卡部署,相比DeepSeek-R1 H20雙節(jié)點部署的方式,成本降至其成本的1/57。針對國產(chǎn)主流芯片的開發(fā)和適配,讓多數(shù)醫(yī)療機構(gòu)利用現(xiàn)有硬件條件可以實現(xiàn)快速部署。
評分上,Baichuan-M2在HealthBench上得到60.1的高分,以32B的較小尺寸不僅反超OpenAI 最新開源模型gpt-oss120b(得分57.6),超過Qwen3-235B、Deepseek R1、Kimi K2等其他開源大模型,略遜于GPT-5-Thinking。
百川智能表示,GPT-5發(fā)布時既沒有開源,也沒有公布參數(shù),無法私有化部署,無法低成本應(yīng)用。相比之下,Baichuan-M2快速免費開源,成為醫(yī)療行業(yè)低成本快速應(yīng)用部署世界頂尖醫(yī)療模型的唯一選擇。
據(jù)悉,百川智能成立于2023年3月,由原搜狗公司CEO王小川創(chuàng)立,團(tuán)隊成員主要來自搜狗、谷歌、騰訊、百度、微軟、字節(jié)等公司。目前,百川智能已完成三輪融資,2024年7月獲得了50億元的A輪融資,并將以200億元估值開啟B輪融資,是中國AI“大模型六虎”之一。
今年以來,百川智能全面做“AI醫(yī)生”。
王小川稱,醫(yī)療大模型是LLM皇冠上的明珠,AI醫(yī)療不僅能提升醫(yī)療服務(wù)的可及性、便利性,還將推動醫(yī)療研究范式的創(chuàng)新。在智能時代,我們不是在造“工具”而是在“造人”,造人代表了知識含量最高,并且需求最廣泛,而醫(yī)療則是其中最有代表性的行業(yè)。神經(jīng)網(wǎng)絡(luò)之父辛頓(Hinton)也強調(diào)了醫(yī)療的重要性,認(rèn)為“醫(yī)療行業(yè)是AI應(yīng)用中最重要的領(lǐng)域之一,能最大化發(fā)揮AI的潛力”。
“為生命建模型、為人類造醫(yī)生,是百川的使命。這是第一天就立下的志向。”王小川曾指出,百川智能是國內(nèi)唯一一個專注醫(yī)療的大模型創(chuàng)業(yè)公司。其在2021年把搜狗公司賣給騰訊的時候就提到,之后的二十年我會專注生命科學(xué)、大眾健康。2022年,他創(chuàng)建了一家做AI檢驗檢測設(shè)備的公司——五季醫(yī)學(xué),它和百川智能實際上是姊妹公司。
今年1月,百川智能推出國內(nèi)首個具備語言、視覺和搜索三大推理能力的開源全場景模型Baichuan-M1-preview,特別解鎖了醫(yī)療循證模式,可整合實時醫(yī)學(xué)證據(jù)進(jìn)行深度推理,同期開源的Baichuan-M1-14B醫(yī)療增強模型,在臨床評測中表現(xiàn)媲美主流大模型(如o1-mini)。
同時,百川Baichuan-M1-preview內(nèi)置行業(yè)內(nèi)首發(fā)的"AI患者模擬器",用真實數(shù)據(jù)構(gòu)造上萬個不同年齡性別癥狀的AI患者,模擬了數(shù)百萬次診療過程。
今年2月,以Baichuan M1大模型為底座打造的“AI兒科醫(yī)生”正式在北京兒童醫(yī)院上崗;今年3月,百川攜手北京兒童醫(yī)院、小兒方健康共同發(fā)布“福棠·百川”兒科大模型。
時隔8個月后,百川智能發(fā)布全新大模型產(chǎn)品,升級患者模擬器并引入模型端到端強化學(xué)習(xí)(RL)能力。
百川智能表示,面向急診、門診等對于交互速度要求更高的場景,相比Baichuan-M1,基于Eagle-3架構(gòu)優(yōu)化的Baichuan-M2 MTP版本在單用戶場景下實現(xiàn)了58.5%的token速度躍升。
實際上,OpenAI于8月6日首次開源兩款大模型,主打部署成本超低和醫(yī)療能力最強。其中,開源gpt-oss系列模型過程中,OpenAI首次將醫(yī)療作為第一重要的評測標(biāo)準(zhǔn);發(fā)布GPT-5時,請到現(xiàn)場的唯一使用者是抗癌患者。
據(jù)悉,OpenAI從HealthBench整體數(shù)據(jù)中選出1000個特別困難復(fù)雜問題作為Hard子集,用于驗證模型多維度、全景化解決疑難復(fù)雜醫(yī)學(xué)問題的能力。今年5月這個評測集發(fā)布時,世界上所有頂尖模型得分都沒超過32分,許多前沿模型得分甚至為0。在OpenAI組織的人類資深醫(yī)生測試中,資深醫(yī)生撰寫的答案甚至未超過o3。
OpenAI在GPT-5發(fā)布時特別強調(diào),其是HealthBench Hard評測全球唯一超過32分的模型。而百川智能表示,Baichuan-M2以34.7分成為全球第二款超過32分的模型。
案例方面,百川智能稱,在北京市海淀區(qū)衛(wèi)健委、北京大學(xué)第三醫(yī)院、國家兒童醫(yī)學(xué)中心等合作伙伴的支持下,M2在真實病例實測中體現(xiàn)出超強能力。例如,一位51歲女士近兩個月睡眠充足仍感覺困倦、疲憊,脖子輕微腫脹。M2根據(jù)醫(yī)患對話,詳細(xì)梳理出持續(xù)性疲勞、體重增加等多個支持診斷的關(guān)鍵癥狀,綜合考慮患者用藥史、年齡、合并癥狀等因素,精準(zhǔn)診斷出患者最可能病因為甲狀腺功能減退癥。
事實上,近期,螞蟻、字節(jié)等大廠都在布局“AI醫(yī)生”這一前沿產(chǎn)業(yè)賽道。
其中,7月初,字節(jié)跳動推出首個AI醫(yī)療助手獨立App“小荷AI醫(yī)生”,主打健康咨詢與報告解讀功能;而螞蟻集團(tuán)也上線獨立健康應(yīng)用“AQ”,加速布局AI醫(yī)療賽道。
據(jù)弗若斯特沙利文預(yù)測,中國AI醫(yī)療市場規(guī)模將從2023年的88億元,快速增長至2033年的3157億元,年復(fù)合增長率高達(dá)43.1%。