彩神官方AI 醫(yī)療公司 OpenEvidence 在 2 月份獲得紅杉資本新一輪的 7500 萬美元融資,估值超過 10 億美元,成為了新的 AI 獨(dú)角獸。
更為耀眼的是它的用戶數(shù)據(jù),官方聲稱,1/4 的美國(guó)用戶醫(yī)生已經(jīng)在使用 OpenEvidence 的工具。
「如果算上所有活躍用戶,每月有 30-40 萬人接觸我們的系統(tǒng),其中 20 多萬醫(yī)生會(huì)登錄并提問。換句線% 的醫(yī)生,已經(jīng)在某種程度上使用 OpenEvidence 了?!?/p>
成立于 2021 年,OpenEvidence 專注于提供專業(yè)的 AI 醫(yī)學(xué)知識(shí)助手,向所有醫(yī)生免費(fèi)開放,通過廣告產(chǎn)生收入,產(chǎn)品迅速實(shí)現(xiàn)了自發(fā)傳播,并與《新英格蘭醫(yī)學(xué)雜志》等出版機(jī)構(gòu)達(dá)成戰(zhàn)略合作。
這種增長(zhǎng)方式也是紅杉投資決策的關(guān)鍵因素。紅杉合伙人 Pat Grady 領(lǐng)導(dǎo)了這一輪投資,他認(rèn)為 OpenEvidence 的采用與消費(fèi)者互聯(lián)網(wǎng)產(chǎn)品的傳播方式相似?!笡]有多少醫(yī)療工具能像消費(fèi)者應(yīng)用程序那樣傳播,但這是其中之一?!?/p>
創(chuàng)始人 Daniel Nadler 最近參與紅杉資本的播客節(jié)目,對(duì)于 AI 醫(yī)療產(chǎn)品的落地、增長(zhǎng),以及如何做沒有幻覺的 AI 模型,輸出了很多干貨信息。Founder Park基于播客節(jié)目整理了文章。
傳統(tǒng)上,醫(yī)療 AI 產(chǎn)品往往需要通過醫(yī)院或其他機(jī)構(gòu)的審批,而 OpenEvidence 直接面向醫(yī)生,讓他們能快速獲取最新醫(yī)學(xué)知識(shí)。這種方式讓產(chǎn)品更快得到廣泛應(yīng)用。
醫(yī)生也是普通人,醫(yī)生也是消費(fèi)者。如果你做出一個(gè)足夠好的產(chǎn)品,能夠真正改變他們的工作方式,甚至改變整個(gè)行業(yè),然后直接放在 AppStore 上,但真的有效。
除了工作時(shí)間長(zhǎng)、醫(yī)學(xué)院的高強(qiáng)度學(xué)習(xí),還有醫(yī)生人數(shù)本來就不夠,他們還要面對(duì)一個(gè)極大的挑戰(zhàn)——醫(yī)學(xué)知識(shí)的更新速度太快,大約每五年翻一倍,根本跟不上。
但對(duì)醫(yī)生來說,幾乎所有情況都是特殊案例,都屬于「邊緣情況」。醫(yī)生的日常工作,就是不停地查找這些特殊案例對(duì)應(yīng)的解決方案。
我們的目標(biāo)是「對(duì)醫(yī)學(xué)做 JPEG 壓縮」。所以,我們的訓(xùn)練數(shù)據(jù)主要是同行評(píng)審的醫(yī)學(xué)文獻(xiàn),以及 FDA(美國(guó)食品藥品監(jiān)督管理局)和 CDC(美國(guó)疾病控制與預(yù)防中心)發(fā)布的權(quán)威信息。
我們解決幻覺的方法就是徹底避免讓 OpenEvidence 連接到公共互聯(lián)網(wǎng),所有訓(xùn)練數(shù)據(jù)都必須是經(jīng)過同行評(píng)審的醫(yī)學(xué)研究。而且我們也不像那些只靠一個(gè)大模型的做法,而是用了多個(gè)模型組成的「集成架構(gòu)」,每個(gè)模型負(fù)責(zé)不同的任務(wù)
雖然已經(jīng)被說了無數(shù)遍,但我也找不到更好的表達(dá)方式:頂尖人才只想和頂尖人才共事。
Daniel Nadler:現(xiàn)在大概有 10 萬名美國(guó)醫(yī)生在用,還有一些來自全球其他地方的用戶。
Daniel Nadler:可能才一千人,甚至更少。其實(shí)很多人可能不知道,美國(guó)大約有 100 萬名醫(yī)生,要為 3.4 億人口提供醫(yī)療服務(wù)。這本身就是個(gè)值得討論的問題。而在這 100 萬名醫(yī)生中,如今大概有 10 萬人每個(gè)月會(huì)使用 OpenEvidence。
如果算上所有活躍用戶,每月有 30-40 萬人接觸我們的系統(tǒng),其中 20 多萬醫(yī)生會(huì)登錄并提問。換句線% 的醫(yī)生,已經(jīng)在某種程度上使用 OpenEvidence 了。
Pat Grady: Sequoia 主要投資科技行業(yè),而不是醫(yī)療行業(yè)。但據(jù)我了解,在醫(yī)療領(lǐng)域,10 萬名醫(yī)生短時(shí)間內(nèi)開始使用一個(gè)新產(chǎn)品,是非常不尋常的。一般來說,醫(yī)療行業(yè)的增長(zhǎng)速度沒這么快。你們到底做對(duì)了什么?
Daniel Nadler:這也是我們合作愉快的原因——因?yàn)槟銈儾皇莻鹘y(tǒng)的醫(yī)療投資人,而我們的做法也不是典型的醫(yī)療行業(yè)做法。我們的關(guān)鍵點(diǎn)在于,我們認(rèn)識(shí)到——醫(yī)生也是普通人,醫(yī)生也是消費(fèi)者。事實(shí)上,每個(gè)人都是消費(fèi)者。而你們的投資策略也抓住了這一點(diǎn),你們不會(huì)把「消費(fèi)者互聯(lián)網(wǎng)」單獨(dú)當(dāng)成一類,然后把醫(yī)療行業(yè)歸為一個(gè)獨(dú)立、封閉、難以滲透的領(lǐng)域。你們把所有行業(yè)都用互聯(lián)網(wǎng)的增長(zhǎng)曲線來看待,我們的思路也是一樣的。
如果你從「自上而下」的方式入手,比如很多人說醫(yī)療行業(yè)很難進(jìn)入,做醫(yī)療創(chuàng)業(yè)太難了,別去碰這個(gè)行業(yè)……
沒錯(cuò)。因?yàn)榇蠹业乃悸范家粯印麄兌荚谟猛瑯拥姆绞健缸矇Α埂K麄兿朕k法去找某個(gè)大型醫(yī)療集團(tuán)的高層,比如首席醫(yī)療信息官(CMIO)或者首席技術(shù)官(CTO),然后想方設(shè)法約個(gè)會(huì),爭(zhēng)取見上一面。哪怕他們?nèi)嗣}再廣,光是把這場(chǎng)會(huì)議安排上,就得等三四個(gè)月。等終于開上第一場(chǎng)會(huì),他們會(huì)興奮地?fù)粽疲骸柑袅耍》答伜芎?!?/p>
然后呢?然后他們要安排第二場(chǎng)會(huì),可能是跟醫(yī)院的「AI 委員會(huì)」開會(huì)。這又得等三個(gè)月。等到真的去開會(huì)了,這期間醫(yī)院的 AI 策略可能已經(jīng)變了,政策環(huán)境可能也變了,甚至美國(guó)總統(tǒng)換了,新政府突然有了新的 AI 監(jiān)管要求。于是會(huì)議又被推遲,一年過去了,他們可能還在第三、第四場(chǎng)會(huì)議的路上。而真正需要這個(gè)工具的醫(yī)生呢?在這個(gè)過程中,他們根本沒機(jī)會(huì)用上。
我在這方面有很多經(jīng)驗(yàn)——這已經(jīng)不是我第一次創(chuàng)業(yè)了。在創(chuàng)辦 OpenEvidence 之前,我已經(jīng)成功賣掉了一家 AI 公司。
Daniel Nadler:我對(duì)美國(guó)大公司的運(yùn)作方式再熟悉不過了。這不只是醫(yī)療行業(yè)的問題,所有大機(jī)構(gòu)運(yùn)作起來都差不多。我很清楚這個(gè)套路,知道它行不通。尤其是對(duì)我來說,這是我的第二家公司,我想做的不是一場(chǎng)漫長(zhǎng)的審批馬拉松,而是真正讓醫(yī)生用得上的產(chǎn)品。如果我花幾年時(shí)間做了一家「有使命感、有影響力」的醫(yī)療AI公司,結(jié)果醫(yī)生根本沒法用,那還有什么意義?所以我們選擇了完全不同的方式。醫(yī)生也是普通人,醫(yī)生也是消費(fèi)者。如果你做出一個(gè)足夠好的產(chǎn)品,能夠真正改變他們的工作方式,甚至改變整個(gè)行業(yè),然后直接放在 AppStore 上——這聽起來像是創(chuàng)業(yè)入門課 101 的內(nèi)容,但真的有效。
我們沒有燒錢做市場(chǎng)推廣,也沒有鋪天蓋地的廣告,一切都是醫(yī)生之間的「口口相傳」。當(dāng)醫(yī)生覺得這個(gè)工具真的好用,他們就會(huì)告訴身邊的同行。然后越來越多人開始用,形成了自然的增長(zhǎng)。這種增長(zhǎng)模式和特斯拉早期的策略很像。特斯拉一開始幾乎不做廣告,而當(dāng)時(shí)汽車廣告是整個(gè)廣告行業(yè)的重頭戲。大家都覺得,要想賣車,必須砸大錢做廣告。但特斯拉說:「我們就做一款超級(jí)棒的車,讓用戶自己去傳播。開過的人會(huì)覺得『天吶,這比其他車好太多了!』然后主動(dòng)推薦給別人?!?/p>
同樣的事情發(fā)生在 OpenEvidence 身上。醫(yī)生從 App Store 試用,覺得好用就推薦給同行。一年前,可能只有幾百上千人用它;今天,已經(jīng)有幾十萬醫(yī)生在用了。大概占美國(guó)所有執(zhí)業(yè)醫(yī)生的 10% -25%。具體比例取決于計(jì)算方式,因?yàn)槟玫叫嗅t(yī)執(zhí)照的醫(yī)生比真正活躍執(zhí)業(yè)的醫(yī)生多,但即使按最低標(biāo)準(zhǔn)計(jì)算,OpenEvidence 也已經(jīng)覆蓋了 10% 以上的美國(guó)醫(yī)生。而這一切,完全是靠產(chǎn)品口碑驅(qū)動(dòng)的。
Pat Grady:大家可能很容易理解「什么是好車」,但「什么是醫(yī)生需要的好應(yīng)用」可能就沒那么直觀了。
Daniel Nadler:我覺得一款產(chǎn)品好不好,最核心的一點(diǎn)就是它能不能真正解決問題。很多科技產(chǎn)品其實(shí)是「先有解決方案,再找問題」,但真正好的產(chǎn)品必須從實(shí)際痛點(diǎn)出發(fā),提供真正有效的解決方案。那么,做醫(yī)生最難的是什么?除了工作時(shí)間長(zhǎng)、醫(yī)學(xué)院的高強(qiáng)度學(xué)習(xí),還有醫(yī)生人數(shù)本來就不夠,他們還要面對(duì)一個(gè)極大的挑戰(zhàn)——
醫(yī)學(xué)知識(shí)的更新速度太快,像消防水管噴涌而出的信息流,根本跟不上。很多人沒意識(shí)到這個(gè)問題,但實(shí)際上,每分鐘就有兩篇新的醫(yī)學(xué)論文發(fā)表,一天 24 小時(shí)不間斷,一周七天都如此。Nature 曾經(jīng)有篇研究表明,醫(yī)學(xué)知識(shí)每 73 天就翻一倍。當(dāng)然,這個(gè)算法可能有點(diǎn)激進(jìn),我們?cè)?OpenEvidence 內(nèi)部做了一次更保守的測(cè)算,
結(jié)果是大約每五年翻一倍。這里的統(tǒng)計(jì)方式很關(guān)鍵,比如如果把所有的引用都算進(jìn)去,可能就會(huì)得出 73 天這個(gè)結(jié)果。但醫(yī)學(xué)研究并不是所有論文的質(zhì)量都一樣,真正對(duì)醫(yī)生有用的,往往是頂尖的期刊,比如影響因子最高的前三分之一的期刊。即便只看這些,醫(yī)學(xué)知識(shí)每五年就翻一倍。如果你稍微算一下,就會(huì)發(fā)現(xiàn)這意味著什么:1950 年,醫(yī)學(xué)知識(shí)大約 50 年翻一倍,而現(xiàn)在是 5 年。換句線 年,一個(gè)醫(yī)生從醫(yī)學(xué)院畢業(yè),他學(xué)到的知識(shí)在整個(gè)職業(yè)生涯中還能管用。到他退休時(shí),可能有一半的知識(shí)過時(shí)了,但影響不大,因?yàn)樗穆殬I(yè)生涯也差不多結(jié)束了。而且那時(shí)候的醫(yī)學(xué)進(jìn)展也沒那么快,所以醫(yī)生還能靠日常學(xué)習(xí)慢慢跟上。
但今天情況完全不同了。醫(yī)生還沒等到完成住院醫(yī)師或進(jìn)修醫(yī)師培訓(xùn),他們?cè)卺t(yī)學(xué)院學(xué)到的內(nèi)容就已經(jīng)有一半過時(shí)了。醫(yī)學(xué)教育曾經(jīng)是醫(yī)生獲取知識(shí)的主要方式,但現(xiàn)在,它能支撐醫(yī)生知識(shí)面的時(shí)間可能只有幾年。
舉個(gè)例子,假設(shè)一個(gè)銀屑病患者去看皮膚科醫(yī)生。理論上,醫(yī)生可以查閱最新的生物制劑研究,挑選最安全、最有效的治療方案。但問題是,皮膚科醫(yī)生可能會(huì)關(guān)注皮膚病相關(guān)的醫(yī)學(xué)期刊,但如果這個(gè)患者同時(shí)患有
?。∕S),那情況就復(fù)雜了。MS 主要屬于神經(jīng)科的研究范疇,指望皮膚科醫(yī)生把所有的神經(jīng)科期刊也都看完,顯然不現(xiàn)實(shí)。更別說不同疾病之間的交叉領(lǐng)域,信息量更是龐大。在這種情況下,醫(yī)生就很難辦。一方面,他們不能隨便給患者開藥,萬一藥物影響了 MS 的病情怎么辦?另一方面,他們也不能什么都不做,因?yàn)轱L(fēng)險(xiǎn)不明確就不治療銀屑病,這對(duì)患者的生活質(zhì)量影響很大。他們需要找到最靠譜的最新研究,比如 IL-17 和 IL-23 抑制劑的療效和安全性,尤其是針對(duì)同時(shí)患有 MS 的患者。
在 OpenEvidence 之前,醫(yī)生要查這些信息特別費(fèi)勁。去 Google 搜?搜不到有用的信息。去 PubMed 查?最多就是給你一堆論文標(biāo)題,但你要的并不是一篇通用的綜述論文,而是一個(gè)非常具體的問題:對(duì)既有銀屑病又有 MS 的患者,IL-17 抑制劑和 IL-23 抑制劑哪個(gè)更安全?哪個(gè)更有效?
讓醫(yī)生可以快速找到最新、最準(zhǔn)確的醫(yī)學(xué)證據(jù)。像這樣的問題,并不是個(gè)例,而是每天都會(huì)發(fā)生的情況。醫(yī)學(xué)涉及的領(lǐng)域太廣了,每一個(gè)病例幾乎都是一個(gè)「邊緣案例」,需要醫(yī)生在大量信息中尋找最相關(guān)的答案。
Daniel Nadler:從工程的角度來看,醫(yī)學(xué)的復(fù)雜度可以說是無限大的。雖然不是真正的「無限」,但對(duì)醫(yī)生來說,幾乎所有情況都是特殊案例,都屬于「邊緣情況」。醫(yī)生的日常工作,就是不停地查找這些特殊案例對(duì)應(yīng)的解決方案。換句話說,如果你能幫助醫(yī)生更高效地找到這些罕見病例的參考資料,比如在頂級(jí)醫(yī)學(xué)期刊里找到關(guān)于銀屑病合并多發(fā)性硬化癥患者,IL-17 和 IL-23 抑制劑安全性比較的研究,那么你就大大改善了醫(yī)生的工作體驗(yàn)。更重要的是,這樣還能提高患者的治療效果,避免因?yàn)獒t(yī)生不知道「IL-17 對(duì)銀屑病效果很好,但對(duì)有多發(fā)性硬化癥的患者來說,IL-23 其實(shí)更安全」這樣的關(guān)鍵信息,而導(dǎo)致病情惡化。醫(yī)生之所以可能不知道這些信息,并不是他們的問題,而是因?yàn)樵谒麄兩厢t(yī)學(xué)院的時(shí)候,這些研究根本還不存在。像 IL-23 抑制劑,2017 到 2019 年才出現(xiàn),就算是現(xiàn)在還很年輕的醫(yī)生,讀書時(shí)也沒學(xué)過這些新知識(shí)。他們只能在畢業(yè)后自己去追蹤最新的研究。但問題是,這種「邊緣情況」太多了,每一個(gè)這樣的案例背后,可能還有成千上萬個(gè)類似的情況需要關(guān)注。在有 OpenEvidence 之前,醫(yī)生要想隨時(shí)跟上這些更新,幾乎是不可能的,而這就可能影響到患者的治療效果。
很多醫(yī)生用 OpenEvidence 后告訴我們,他們會(huì)用它來查找那些自己一輩子可能只遇到一兩次的病例。而當(dāng)越來越多醫(yī)生都這樣說,涉及的病例各不相同時(shí),我們就意識(shí)到,醫(yī)學(xué)知識(shí)的「長(zhǎng)尾」有多么驚人——雖然沒有真正無限長(zhǎng),但對(duì)人腦來說,已經(jīng)復(fù)雜到幾乎無法完全掌握。
而 OpenEvidence 的作用,就是幫助醫(yī)生在這條漫長(zhǎng)的「長(zhǎng)尾」里,精準(zhǔn)找到他們需要的知識(shí)。
Pat Grady:醫(yī)學(xué)知識(shí)增長(zhǎng)的速度非??欤@本來是件好事,但問題在于,醫(yī)生的學(xué)習(xí)能力是有限的,無法完全消化這些海量的新信息。就像一個(gè)不斷被裝滿的桶,里面的「潛在能量」很大,但沒法順利轉(zhuǎn)化成「動(dòng)能」,因?yàn)獒t(yī)生無法高效地吸收和應(yīng)用這些信息。AI 擅長(zhǎng)處理海量文本、進(jìn)行推理,所以 AI 的出現(xiàn)正好可以解決這個(gè)問題,把這些醫(yī)學(xué)知識(shí)轉(zhuǎn)化成醫(yī)生真正可用的工具。
Daniel Nadler:簡(jiǎn)單來說,OpenEvidence 的「evidence」就是經(jīng)過同行評(píng)審的醫(yī)學(xué)文獻(xiàn)。更重要的是,我們要明確它不是什么。過去很多大公司嘗試用 AI 做醫(yī)學(xué)應(yīng)用,但最后「翻車」了,其中一個(gè)重要原因就是它們的數(shù)據(jù)來源有問題——它們直接從網(wǎng)上抓取信息,比如各種健康博客,甚至是社交媒體上的帖子。而這些內(nèi)容的作者,大多數(shù)既不是醫(yī)生,也沒有醫(yī)學(xué)背景,很多人同時(shí)還寫旅游攻略、做美食博客,真正的專業(yè)知識(shí)有限。問題是,AI 學(xué)習(xí)的內(nèi)容就是這些博客里的信息,所以當(dāng)大模型在早期階段輸出一些荒謬的醫(yī)學(xué)建議時(shí),問題不在于 AI「瘋了」,而是它學(xué)到的東西本來就不夠?qū)I(yè)。而 OpenEvidence 完全走了另一條路,我們的模型不聯(lián)網(wǎng),不會(huì)去抓取互聯(lián)網(wǎng)上的內(nèi)容。我們的數(shù)據(jù)來源是像《新英格蘭醫(yī)學(xué)雜志》這樣的頂級(jí)醫(yī)學(xué)期刊,我們還和他們建立了戰(zhàn)略合作關(guān)系。
Pat Grady:《新英格蘭醫(yī)學(xué)雜志》一般不會(huì)隨便授權(quán)AI公司使用他們的研究數(shù)據(jù)吧?
Daniel Nadler:確實(shí)不會(huì)。據(jù)我所知,我們是唯一一家獲得授權(quán)的 AI 公司。很多 AI 公司都去找他們談合作,但基本都被拒絕了。
Pat Grady:為什么他們似乎信任 OpenEvidence,而不信任其他公司?你們到底有什么特別的地方,讓他們?cè)敢夂献鳎?/p>
具體的細(xì)節(jié)就不展開了,簡(jiǎn)單來說,很多知名 AI 公司去找《新英格蘭醫(yī)學(xué)雜志》,問他們:「我們能用你們的數(shù)據(jù)來訓(xùn)練模型嗎?」結(jié)果被直接拒絕了。我不去揣測(cè)他們拒絕的具體原因,也不能替他們發(fā)言,但總之他們說了「不」。而我們的情況完全不同,我們壓根沒去主動(dòng)找他們,而是他們主動(dòng)找到我們。怎么回事呢?《新英格蘭醫(yī)學(xué)雜志》編輯委員會(huì)里的幾位重量級(jí)人物本身就是 OpenEvidence 的深度用戶,他們希望自己常用的工具里能包含他們的內(nèi)容。
這就是最理想的情況,對(duì)吧?所以他們主動(dòng)找上門來,我們也花了很多時(shí)間去打磨合作框架,確保合作方式符合他們的品牌定位,保護(hù)他們的學(xué)術(shù)權(quán)威性。畢竟,他們是醫(yī)學(xué)界的「天花板」,是行業(yè)頂尖的醫(yī)學(xué)期刊,而且他們是非盈利機(jī)構(gòu),不是靠商業(yè)化賺錢的。就算有人砸再多錢,他們也不會(huì)因?yàn)殄X而輕易妥協(xié)。事實(shí)上,一些資金雄厚的 AI 公司確實(shí)嘗試用巨額資金打動(dòng)他們,但他們依然拒絕了。如果他們是私營(yíng)企業(yè),可能會(huì)接受,但他們是由馬薩諸塞州醫(yī)學(xué)會(huì)運(yùn)營(yíng)的非營(yíng)利機(jī)構(gòu),他們更看重自己的學(xué)術(shù)使命,而不是短期的商業(yè)利益。對(duì) OpenEvidence 來說,這個(gè)合作就像是「水到渠成」。雜志社的核心人員本身就是我們的用戶,他們用了覺得好,就主動(dòng)找我們談合作。如果我們采取傳統(tǒng)的企業(yè) SaaS 推廣模式,比如先花很長(zhǎng)時(shí)間去談醫(yī)院的大規(guī)模合作,等著參加第 17 次會(huì)議,還沒用戶使用,那《新英格蘭醫(yī)學(xué)雜志》的人也不會(huì)接觸到這個(gè)產(chǎn)品,更談不上喜歡上它。最終,我們也不會(huì)有這個(gè)機(jī)會(huì)達(dá)成合作。
所以,這就形成了一個(gè)良性循環(huán):我們把產(chǎn)品免費(fèi)推出去,讓人們自發(fā)使用,然后核心用戶群里剛好有《新英格蘭醫(yī)學(xué)雜志》的重要人物,他們用著覺得不錯(cuò),就主動(dòng)找到我們,最終促成了合作。現(xiàn)在,我們的模型可以基于他們完整的數(shù)據(jù)進(jìn)行訓(xùn)練,而市場(chǎng)上其他 AI 產(chǎn)品都做不到這一點(diǎn),我可以很肯定地說,目前 OpenEvidence 是唯一一個(gè)完整訓(xùn)練了《新英格蘭醫(yī)學(xué)雜志》全文的 AI 產(chǎn)品。
Pat Grady:剛才聊了「Evidence」這個(gè)詞的含義,現(xiàn)在來說說「Open」。為什么「Open」這么重要?它意味著什么?
Daniel Nadler:「Open」對(duì)我來說,一開始就意味著很多東西,其中最核心的一點(diǎn)是我們的市場(chǎng)策略。它時(shí)刻提醒我,OpenEvidence 不是一家傳統(tǒng)的企業(yè) SaaS 公司。我的第一家公司就是做企業(yè) SaaS 的,那種模式可以很賺錢,你也很清楚,企業(yè) SaaS 賽道能跑出很多成功的公司。但在做第二家公司的時(shí)候,我不想重復(fù)自己,我希望它不僅僅是個(gè)有影響力、有使命驅(qū)動(dòng)的公司,還要和我的第一家公司完全不同。所以,我決定不走企業(yè) SaaS 模式,而是直接面向個(gè)人用戶,或者更準(zhǔn)確地說,面向「專業(yè)用戶」?!窸pen」這個(gè)詞,就代表了這種理念:
我們直接觸達(dá)醫(yī)生,而不是讓醫(yī)院管理層或其他人來做中間商。醫(yī)生是直接的使用者,他們的痛點(diǎn)很明顯——工作負(fù)擔(dān)過重、時(shí)間不夠、患者太多,還要處理海量的醫(yī)學(xué)信息。我們的目標(biāo)就是幫他們解決這個(gè)問題,讓他們更輕松地獲取關(guān)鍵信息。此外,「Open」還代表著醫(yī)療信息的公平性。在美國(guó)的醫(yī)療體系里,資源分配非常不均衡,就像社會(huì)其他領(lǐng)域一樣,有錢的醫(yī)院可以買到所有最先進(jìn)的工具,甚至有預(yù)算去試用各種軟件,但最終可能真正使用的寥寥無幾。如果你讓馬斯克去審計(jì)這些頂級(jí)醫(yī)院的 SaaS 支出,他估計(jì)會(huì)大跌眼鏡——他們買了一堆工具,但真正用的卻少之又少。
Daniel Nadler:你看,一方面大型醫(yī)院、研究機(jī)構(gòu)在用高端科技,但另一方面,在美國(guó)農(nóng)村地區(qū),或者一些經(jīng)濟(jì)條件較差的城市里,很多醫(yī)生其實(shí)是私人執(zhí)業(yè),或者是在小型診所里工作,比如不到 10 人的團(tuán)隊(duì)。很多人可能不知道,其實(shí)醫(yī)生也是小企業(yè)主,他們不是都在那些資金雄厚的大型醫(yī)院系統(tǒng)里上班。很多醫(yī)生是自己開診所的,就像上世紀(jì) 50 年代那樣,他們有自己的診所,可能只有一兩個(gè)行政助理或者秘書幫忙,剩下的所有事都得自己操心——看病、管理、處理各種行政事務(wù),全都?jí)涸谒麄兩砩?。而且他們沒有龐大的科技預(yù)算,更別提像大學(xué)那種基金會(huì)支持了。他們根本負(fù)擔(dān)不起每年 1 萬、2 萬美元的軟件訂閱費(fèi)。所以,這就是「開放」的意義。我們收到一封來自喬治亞州奧爾巴尼的一位醫(yī)生的信,他是當(dāng)?shù)匾患野┌Y中心的主任,同時(shí)也是一名社區(qū)腫瘤醫(yī)生。他說 OpenEvidence 已經(jīng)成為他日常行醫(yī)的生命線,讓他的癌癥治療方式發(fā)生了巨大變化。而我對(duì)奧爾巴尼并不了解,就上網(wǎng)查了一下,發(fā)現(xiàn)這里位于喬治亞州西南部,75% 的人口是非裔美籍,家庭收入中位數(shù)是 4.3 萬美元/年。
然后我開始拼湊這個(gè)醫(yī)生的處境——他可能是方圓 50 英里內(nèi)唯一的腫瘤科醫(yī)生,或者就算有第二個(gè)醫(yī)生,也要服務(wù)大范圍、經(jīng)濟(jì)條件一般的患者。他根本不可能拿出 1 萬、2 萬美元去訂購 SaaS 軟件。而這就是「開放」的意義。我們還收到來自阿拉斯加費(fèi)爾班克斯的一封信,一位醫(yī)生說她在當(dāng)?shù)氐纳鐓^(qū)診所工作,幾乎沒有機(jī)會(huì)接觸到??漆t(yī)生。OpenEvidence 讓她能夠獲取??萍?jí)別的醫(yī)學(xué)知識(shí),即便她所在的地方根本沒有相關(guān)的專家資源。
想想這個(gè)場(chǎng)景,她在一個(gè)小型社區(qū)診所,不是在有充足資金的大醫(yī)院上班,她根本不可能花大價(jià)錢買這些軟件。所以,這就是「開放」的意義——它適用于全國(guó)的每一位醫(yī)生。我們很自豪,OpenEvidence 不僅僅被梅奧診所(美國(guó)著名的醫(yī)療機(jī)構(gòu))使用,我們當(dāng)然很喜歡梅奧診所,甚至曾在那孵化過一部分產(chǎn)品,很多頂級(jí)醫(yī)院的醫(yī)生也在用它,但它的價(jià)值不僅限于這些精英醫(yī)療機(jī)構(gòu)。我們的用戶遍布全美,從鄉(xiāng)村診所到城市醫(yī)院,從梅奧診所到克利夫蘭診所,甚至在沃爾特·里德國(guó)家軍事醫(yī)療中心,幫助政府為士兵和提供治療,而政府不需要花三年時(shí)間走采購流程。
再舉個(gè)例子,美國(guó)事務(wù)部(VA)是全國(guó)最大的醫(yī)療系統(tǒng)之一,也是最重要的醫(yī)療體系之一,因?yàn)樗鼮檐娙撕吞峁┲委?。?VA 采購新技術(shù)通常需要三年時(shí)間,如果 OpenEvidence 不是開放的,我們可能還在政府的審批流程里徘徊,等著決定 VA 里的醫(yī)生能不能用它來幫助。而現(xiàn)在,我們已經(jīng)收到來自 VA 醫(yī)生的信,他們說 OpenEvidence 在關(guān)鍵時(shí)刻幫助他們做出治療決定,改善了的護(hù)理質(zhì)量。這讓我每天醒來都充滿動(dòng)力。這就是「開放」的意義。
Pat Grady:你們算是為醫(yī)療行業(yè)打造了一款「殺手級(jí)應(yīng)用」,而且效果很好。我們的很多聽眾也在做類似的事情,試圖用 AI 打造自己的「殺手級(jí)應(yīng)用」。所以,我很好奇,你們是怎么做出來的?它是基于 GPT-3 或 GPT-4 的某種封裝嗎?背后的技術(shù)是什么?能不能講講?
Daniel Nadler:我分兩部分來講,一部分是我們是怎么做的,另一部分是對(duì)聽眾來說有哪些可借鑒的地方。我猜很多聽眾的應(yīng)用可能不像醫(yī)療領(lǐng)域這么特殊,所以也想談?wù)劯ㄓ玫姆椒āT卺t(yī)療領(lǐng)域,我們的解決方式是組建了一支博士級(jí)別的科學(xué)家團(tuán)隊(duì)。我的聯(lián)合創(chuàng)始人 Zachary Ziegler 是哈佛的計(jì)算機(jī)科學(xué)家,師從 NLP 領(lǐng)域的頂級(jí)學(xué)者 Alexander Rush。Evan Hernandez 來自 MIT 的 Jacob Andreas 實(shí)驗(yàn)室,還有 Eric Lehman 也是 MIT 的。我們招募了一群站在語言模型最前沿的科學(xué)家,他們來自當(dāng)時(shí)全球最強(qiáng)的兩三所研究機(jī)構(gòu)。
為什么要這么做?因?yàn)槲覀円鉀Q的是醫(yī)學(xué)領(lǐng)域的問題,而這個(gè)問題門檻極高、難度極大,當(dāng)時(shí)還沒有人真正解決。那些大互聯(lián)網(wǎng)公司做的醫(yī)學(xué) AI 產(chǎn)品,早期基本都翻車了,出過不少尷尬的事故,大家應(yīng)該都記得。所以,我們的策略是結(jié)合學(xué)術(shù)和工程實(shí)力來攻克這個(gè)問題。我們不僅僅是在做工程實(shí)現(xiàn),還在做原創(chuàng)的研究和知識(shí)探索。
當(dāng)時(shí)整個(gè)行業(yè)的趨勢(shì)是拼模型規(guī)模,所有人都在追求更大的語言模型,比如 DeepMind 出的
論文*,大家都在討論「更大、更大、更大」。但我們反其道而行之,我們的思路是——與其追求龐大的通用模型,不如訓(xùn)練更小、更專業(yè)化的模型,在特定領(lǐng)域里做到極致。今天這已經(jīng)成了共識(shí),比如 DeepSeek 也在走類似的路,但在 2022 年那個(gè)時(shí)候,這并不是顯而易見的選擇。
我們的模型在通用對(duì)話上可能很差,寫詩、閑聊這些完全不行,一旦離開醫(yī)學(xué)領(lǐng)域就會(huì)崩潰。但在醫(yī)學(xué)領(lǐng)域,它的表現(xiàn)極其精準(zhǔn),效果遠(yuǎn)超那些大而全的模型。我們以學(xué)術(shù)的方式去做這件事,發(fā)表了論文《我們還需要臨床語言模型嗎?*》(Do We Still Need Clinical Language Models?)。這篇論文在 2023 年被評(píng)為醫(yī)療 AI 領(lǐng)域最佳論文,吸引了很多關(guān)注。這是行業(yè)里第一篇明確提出「在醫(yī)學(xué)領(lǐng)域,小而精的模型比大模型更好」的研究。
現(xiàn)在回頭看,大家可能會(huì)覺得這個(gè)思路很合理,但在當(dāng)時(shí),行業(yè)的主流方向還是規(guī)?;瘮U(kuò)展。我們的做法類似于 JPEG 壓縮,語言模型就像是對(duì)世界的「壓縮」。關(guān)鍵問題是:你在壓縮什么樣的「世界」?這又回到了我們之前討論的公共互聯(lián)網(wǎng)。
Daniel Nadler:如果說大模型是在對(duì)整個(gè)互聯(lián)網(wǎng)做「JPEG 壓縮」,那它們的訓(xùn)練方式其實(shí)就是盡可能多地獲取數(shù)據(jù),越多越好。那么,所有這些數(shù)據(jù)從哪來?當(dāng)然是公共互聯(lián)網(wǎng)。但就像 Ilya 說的,你到底在壓縮什么呢?你壓縮的就是整個(gè)公共互聯(lián)網(wǎng)。這也就是為什么 2022 年底、2023 年初的時(shí)候,很多大模型的輸出會(huì)顯得有點(diǎn)尷尬,是因?yàn)樗鼈兊摹笁嚎s」方式導(dǎo)致的。而我們的方法不太一樣,我們的目標(biāo)是「對(duì)醫(yī)學(xué)做 JPEG 壓縮」。所以,我們的訓(xùn)練數(shù)據(jù)主要是同行評(píng)審的醫(yī)學(xué)文獻(xiàn),以及 FDA(美國(guó)食品藥品監(jiān)督管理局)和 CDC(美國(guó)疾病控制與預(yù)防中心)發(fā)布的權(quán)威信息。幸運(yùn)的是,在我們正式和《新英格蘭醫(yī)學(xué)雜志》(NEJM)合作之前,我們已經(jīng)發(fā)現(xiàn)了一個(gè)關(guān)鍵優(yōu)勢(shì):根據(jù)美國(guó)版權(quán)法,美國(guó)政府創(chuàng)作的內(nèi)容默認(rèn)屬于公共領(lǐng)域。這也是能夠使用大量公共數(shù)據(jù)的原因之一。
?。ㄖR(shí)共享許可協(xié)議)下的公開數(shù)據(jù)。這個(gè)方法不是所有領(lǐng)域都能用,比如法律、會(huì)計(jì)、稅務(wù)等很多信息都受保護(hù)。但醫(yī)學(xué)領(lǐng)域的很多高質(zhì)量?jī)?nèi)容,尤其是 FDA 和 CDC 發(fā)布的信息,都是免費(fèi)的。所以,我們用這些數(shù)據(jù)做訓(xùn)練,同時(shí)規(guī)避了版權(quán)問題,建立了一個(gè)足夠好用的系統(tǒng),讓醫(yī)生可以使用。這樣,我們就吸引了像《新英格蘭醫(yī)學(xué)雜志》這樣的機(jī)構(gòu)主動(dòng)聯(lián)系合作,最終拿到了更多原本受版權(quán)保護(hù)的內(nèi)容。這種「飛輪效應(yīng)」逐步推動(dòng)了整個(gè)系統(tǒng)的成長(zhǎng)。我們的方式非常技術(shù)導(dǎo)向,也非常學(xué)術(shù)化,主要是因?yàn)獒t(yī)學(xué)領(lǐng)域的準(zhǔn)確性太重要了,不能出錯(cuò)。
Pat Grady:對(duì),我正想問你這個(gè)問題?,F(xiàn)在很多醫(yī)生在用 OpenEvidence 來做臨床決策,那它的「幻覺」(hallucination)問題怎么解決?
Daniel Nadler:是的。而且,順便說一句,這也是給創(chuàng)業(yè)者或者工程師的一點(diǎn)思考,有些應(yīng)用場(chǎng)景里,幻覺不只是「沒那么煩人」,甚至是個(gè)「特色功能」。比如 Midjourney,就是個(gè)很好的例子。
Daniel Nadler:Midjourney 其實(shí)就是靠「幻覺」做出獨(dú)特的藝術(shù)效果的。所以,有時(shí)候,聰明的做法不是把幻覺當(dāng)成缺陷,而是想辦法把它變成優(yōu)勢(shì)。說到這,我想到一個(gè)可以創(chuàng)業(yè)的點(diǎn)子——如果要在金融領(lǐng)域用大模型,那其實(shí)可以反過來利用幻覺,把它當(dāng)成風(fēng)險(xiǎn)管理的工具。金融行業(yè)有一個(gè)核心問題就是「黑天鵝事件」(極端低概率但高影響的風(fēng)險(xiǎn))。傳統(tǒng)的計(jì)算機(jī)系統(tǒng)很難想象這些極端情況,但大模型的「幻覺」能力可能剛好能彌補(bǔ)這個(gè)短板。我自己就做過一些實(shí)驗(yàn),把我的投資組合信息喂給模型,然后讓它「幻想」可能的風(fēng)險(xiǎn)。它給出的結(jié)果有時(shí)候讓我挺驚訝的,比如我很喜歡英偉達(dá),但模型居然能想到一些我自己完全沒考慮過的潛在風(fēng)險(xiǎn)。
所以,大模型的應(yīng)用才剛剛開始,我們現(xiàn)在也許只開發(fā)了 1% 的潛力,還有 99% 的可能性等著被發(fā)掘。對(duì)于創(chuàng)業(yè)者來說,這其實(shí)是個(gè)巨大的機(jī)會(huì)。
我們解決幻覺的方法就是徹底避免讓 OpenEvidence 連接到公共互聯(lián)網(wǎng),所有訓(xùn)練數(shù)據(jù)都必須是經(jīng)過同行評(píng)審的醫(yī)學(xué)研究。而且我們也不像那些只靠一個(gè)大模型的做法,而是用了多個(gè)模型組成的「集成架構(gòu)」,每個(gè)模型負(fù)責(zé)不同的任務(wù),比如檢索、排序等。這樣才能達(dá)到 OpenEvidence 目前的準(zhǔn)確度。這些模型的「JPEG 壓縮」對(duì)象,只包含同行評(píng)審的醫(yī)學(xué)文獻(xiàn),所以它不會(huì)生成超出這些文獻(xiàn)的信息。這就解決了一半的問題,而另一半的問題,是讓醫(yī)生能直接查看答案的來源。我們很早就做了這點(diǎn),甚至比 ChatGPT 還早。我們的系統(tǒng)會(huì)提供可追溯的參考文獻(xiàn),醫(yī)生可以點(diǎn)進(jìn)去,直接查閱相關(guān)研究。這樣不僅提升了可信度,還讓醫(yī)生真正能依賴它做決策。
這個(gè)方法還意外帶來了和醫(yī)學(xué)期刊的雙贏合作。我們并不是簡(jiǎn)單地「壓縮」期刊的內(nèi)容然后輸出,而是直接把流量送回期刊網(wǎng)站。結(jié)果我們幫助醫(yī)學(xué)期刊獲得了數(shù)千萬次訪問量,很多醫(yī)生因?yàn)?OpenEvidence 的推薦,發(fā)現(xiàn)了他們本來不會(huì)注意到的研究。這就形成了一個(gè)良性循環(huán),醫(yī)學(xué)期刊也愿意讓我們收錄他們的內(nèi)容,最終受益的是醫(yī)生和患者。
更有意思的是,很多醫(yī)學(xué)協(xié)會(huì)也主動(dòng)找上門來,希望我們能收錄他們的指南。這樣一來,不僅醫(yī)生能獲得更準(zhǔn)確的信息,期刊和協(xié)會(huì)也能得到更多關(guān)注,整個(gè)生態(tài)都受益。這才是 OpenEvidence 真正的價(jià)值所在——它不僅提供了準(zhǔn)確的醫(yī)學(xué)信息,還搭建了一個(gè)對(duì)所有人都有利的知識(shí)共享平臺(tái)。
Pat Grady:Kensho *已經(jīng)創(chuàng)立十多年了,這些年AI和機(jī)器學(xué)習(xí)的發(fā)展突飛猛進(jìn)。如果我們對(duì)比 Kensho 和 OpenEvidence 的底層架構(gòu),有多少是一樣的?又有哪些不同?其實(shí)我想問背后的問題是,一個(gè)真正能跑起來的 AI 應(yīng)用,究竟有多少是靠最近的技術(shù)突破?又有多少是建立在傳統(tǒng)的工程和機(jī)器學(xué)習(xí)方法之上的?
Kensho 誕生的時(shí)候,根本還沒有大語言模型,甚至連小一點(diǎn)的語言模型都沒有,還沒有 BERT,基本上什么都沒有。甚至可以說,那時(shí)候連「火」都快沒了。
Daniel Nadler:所以很難比較,對(duì)吧?當(dāng)時(shí) Kensho 其實(shí)是 NLP 領(lǐng)域的早期嘗試。當(dāng)然,到我把公司賣掉的時(shí)候,它已經(jīng)成熟很多了。但如果你回到 2013 年我剛創(chuàng)立 Kensho 的時(shí)候,那和今天完全是兩個(gè)時(shí)代。不過,有一點(diǎn)是相同的:無論做什么AI,底層的基礎(chǔ)架構(gòu)都非常重要。比如,我們自己訓(xùn)練模型,剛才也聊過這個(gè)。即使你不訓(xùn)練自己的模型,只是接一個(gè)現(xiàn)成的大模型 API,一旦你的產(chǎn)品做得足夠好,流量上來了,它遲早會(huì)崩掉。而你肯定希望自己能做到這一步,做到 API 頂不住的程度。而當(dāng)它真的崩掉的時(shí)候,你就需要傳統(tǒng)軟件工程里那一整套基礎(chǔ)設(shè)施,必須有非常扎實(shí)的工程能力才能支撐起來。
這點(diǎn) Kensho 和 OpenEvidence 是一樣的,因?yàn)樗鼈兌际歉咭蟮南到y(tǒng)。拿金融領(lǐng)域來說,海量資金都是基于這些數(shù)據(jù)流動(dòng)的,你不可能讓系統(tǒng)在交易過程中突然崩掉。所以這其實(shí)是件好事。我覺得,ChatGPT 爆火之后,很多人擔(dān)心「游戲規(guī)則是不是變了?」
但我要說,規(guī)則并沒有變。技術(shù)確實(shí)更先進(jìn)了,這是一個(gè)持續(xù)發(fā)展的過程。技術(shù)一直都在進(jìn)步,比如 1982 到 1987,或者 1993 到 1997,每個(gè)時(shí)代技術(shù)都會(huì)比之前更強(qiáng)。這次的進(jìn)步確實(shí)是個(gè)飛躍,有非線性的增長(zhǎng),甚至可以說是指數(shù)級(jí)的提升。是的,Ray Kurzweil 說的都對(duì),他早就預(yù)測(cè)到了。但從更宏觀的角度看,這仍然是一個(gè)循序漸進(jìn)的過程,就像物理學(xué)的定律不會(huì)突然改變,哪怕我們?cè)谘芯抗馑俾眯校瑥氖种还馑偬嵘蕉种还馑?,技術(shù)復(fù)雜度可能呈指數(shù)級(jí)增長(zhǎng),但物理定律始終沒變。AI 也是一樣,它的發(fā)展是非線性的,但本質(zhì)上還是一個(gè)連續(xù)的過程。所以從工程和創(chuàng)業(yè)的角度來看,過去重要的東西今天依然重要。在 Kensho 時(shí)代重要的事情,今天在 OpenEvidence 依然重要。
還有一點(diǎn),團(tuán)隊(duì)的水平也很關(guān)鍵。Kensho 和 OpenEvidence 之所以能成功,很大程度上是因?yàn)槲覀冋业搅朔浅B斆鞯娜藖碜鲞@件事。
Pat Grady:說到團(tuán)隊(duì),你剛才提到了 Zach、Evan、Eric 和 Micah。你是怎么吸引到這些人的?面對(duì)那么多選擇,他們?yōu)槭裁丛敢饧尤?OpenEvidence?
這個(gè)問題 Steve Jobs 早就說過了,雖然已經(jīng)被說了無數(shù)遍,但我也找不到更好的表達(dá)方式:頂尖人才只想和頂尖人才共事。精英人才想要和精英人才待在一起。這就像海豹突擊隊(duì)的 BUD/S(海軍海豹突擊隊(duì)的篩選過程)選拔,很多人報(bào)名參加,不是因?yàn)樗麄冇X得自己一定能成功,而是他們想看看自己能不能跟上隊(duì)伍。他們想挑戰(zhàn)自己,想知道自己的極限在哪。這種心態(tài),從古希臘時(shí)代就有了,無論是在戰(zhàn)爭(zhēng)、工程、體育,還是金融領(lǐng)域,最優(yōu)秀的人都想知道自己到底有多強(qiáng),而唯一的方法就是和最優(yōu)秀的人競(jìng)爭(zhēng),看看自己能不能匹配上他們的水平。
所以,這就是我在 Kensho 的做法,而現(xiàn)在在 OpenEvidence 也是一樣的,事實(shí)證明,這種方式非常有效。雖然現(xiàn)在這個(gè)觀點(diǎn)可能有點(diǎn)「政治不正確」,但說實(shí)話,我就是想找高智商的人,除此之外,我不在乎別的。我不在乎你的背景、長(zhǎng)相、身份,我只在乎你是不是一個(gè)聰明到極致的人。這就是事實(shí),我也沒法掩飾。
回到團(tuán)隊(duì),比如 OpenEvidence 最初的核心成員:Zachary Ziegler、Jonas Wolf、Evan Hernandez、Eric Lehman、Micah Smith,他們幾乎都是哈佛或 MIT 的博士。但我要澄清,這不是因?yàn)槲铱桃馊ミ@些學(xué)校找人,而是因?yàn)樵?Kensho 的經(jīng)驗(yàn)讓我意識(shí)到,如果你讓高智商、學(xué)習(xí)速度極快的人去攻克一個(gè)難題,他們的進(jìn)展會(huì)遠(yuǎn)超一支普通規(guī)模大 100 倍的團(tuán)隊(duì)。
對(duì)所有在聽的人來說,最讓人安心的一點(diǎn)就是,游戲規(guī)則沒變。物理定律沒變,重要的事情依然重要:頂級(jí)團(tuán)隊(duì)、高智商人才、高學(xué)習(xí)能力的人、極度渴望成功的人、強(qiáng)烈的求知欲,這些都還是關(guān)鍵因素。
而當(dāng)我說「高智商」時(shí),我指的是 高神經(jīng)可塑性(neuroplasticity)。我指的是大腦學(xué)習(xí)新知識(shí)、適應(yīng)新環(huán)境的能力,而不是能多快解開魔方(因?yàn)榻饽Х胶?IQ 其實(shí)沒什么強(qiáng)相關(guān)性)。
沒錯(cuò)。所謂的高智商,就是指能快速吸收、理解、應(yīng)用全新的知識(shí)。而這在任何時(shí)代都重要——1000 年前重要,3000 年前也重要,只不過應(yīng)用的領(lǐng)域不同了。以前是在戰(zhàn)爭(zhēng)、軍事戰(zhàn)術(shù)、孫子兵法里,現(xiàn)在是在 AI、工程、金融等領(lǐng)域。我平時(shí)喜歡研究軍事歷史,像克勞塞維茨、馬基雅維利、孫子這些經(jīng)典的戰(zhàn)爭(zhēng)理論,也研究拿破侖、亞歷山大大帝這些歷史人物。他們并不是軍隊(duì)里體格最強(qiáng)壯的人,但他們有一個(gè)共同點(diǎn),就是能在瞬息萬變的戰(zhàn)場(chǎng)上,完全調(diào)整自己的思維方式,迅速適應(yīng)新的戰(zhàn)局。
這就是我們現(xiàn)在所說的「神經(jīng)可塑性」——他們能夠在最短的時(shí)間內(nèi)調(diào)整自己的認(rèn)知框架,找到最優(yōu)解。
過去 3000 年里,人類的活動(dòng)方式確實(shí)變化很大。戰(zhàn)爭(zhēng)仍然存在,但大多數(shù)人已經(jīng)不再像古希臘城邦時(shí)代那樣為了生存而戰(zhàn)斗。但不變的是,想要取得突破性成功,核心仍然是大腦的學(xué)習(xí)能力和適應(yīng)能力。
Pat Grady:第一個(gè)問題。這個(gè)數(shù)字肯定沒法準(zhǔn)確衡量,因?yàn)樗枰粋€(gè)「假如沒有」的對(duì)比場(chǎng)景。但我們猜測(cè),OpenEvidence 的使用方式可能真的在挽救生命,比如幫助醫(yī)生做出更好的臨床決策。那么,我們什么時(shí)候可以說 OpenEvidence 已經(jīng)拯救了一百萬條生命?
一百萬條生命?這感覺像在做麥肯錫的面試題,需要推理一下,比如說,如果有 15 萬或 50 萬名醫(yī)生在用,每個(gè)醫(yī)生每天要看多少病人?其中有多少是危及生命的情況?我是這樣想的……
我的算法是,這取決于數(shù)據(jù)來源,但每年大約有 30 萬到 80 萬人死于醫(yī)療失誤。當(dāng)然,并不是所有這些死亡都跟醫(yī)生當(dāng)場(chǎng)的決策有關(guān),可能還有其他因素。但我們先取 30 萬這個(gè)低值,再砍一半,得到 15 萬。這樣算下來,大概 6 年半就能達(dá)到一百萬的數(shù)字。當(dāng)然,這是在 OpenEvidence 完全普及的情況下,所以再給它幾年發(fā)展時(shí)間,可能 8 到 9 年后,也就是 2034 年 11 月 4 日,我們能達(dá)到這個(gè)目標(biāo)。
我唯一想補(bǔ)充的是,2030 年代,OpenEvidence 可能真的已經(jīng)拯救了一百萬條生命,但這不包括那些因?yàn)獒t(yī)生避免了用錯(cuò)藥而沒有惡化的病人,比如今天有個(gè)醫(yī)生沒有給 MS(多發(fā)性硬化癥)患者開錯(cuò)生物制劑。這樣的情況每天都在發(fā)生。還有一個(gè)醫(yī)生在羅德島給我們寫信,說他用 OpenEvidence 判斷病人癥狀是否符合肺栓塞,最后發(fā)現(xiàn)確實(shí)符合,于是立刻送進(jìn)急診,救了病人的命。所以,OpenEvidence 其實(shí)已經(jīng)在救人了,我們知道這點(diǎn),因?yàn)獒t(yī)生告訴了我們。但類似這樣的例子很多,有的病人可能只是病情沒變嚴(yán)重,或者一些并發(fā)癥被及時(shí)控制。這種影響的規(guī)模,早就達(dá)到百萬級(jí)了。
Pat Grady:好的,下一個(gè)問題。你覺得大模型會(huì)不會(huì)變成一個(gè)通用的、標(biāo)準(zhǔn)化的商品?
我覺得它們確實(shí)在變得越來越強(qiáng),成本也在下降。而且 Ray Kurzweil 說的基本上都對(duì)。所以最前沿的東西不會(huì)被「商品化」,因?yàn)榍把赜肋h(yuǎn)是前沿。但如果說 ChatGPT 剛推出時(shí)那種「哇塞」的感覺,它的成本最終會(huì)趨近于零。
這就是為什么我覺得,真正有趣的商業(yè)機(jī)會(huì)不在底層大模型,而是在應(yīng)用層面。當(dāng)然,在大模型層面依然有很多學(xué)術(shù)上、科學(xué)上的突破,但從商業(yè)角度來說,最偉大的公司會(huì)出現(xiàn)在應(yīng)用層。
Pat Grady:總結(jié)得很好。那 AGI(通用人工智能)呢?你覺得它已經(jīng)實(shí)現(xiàn)了嗎?或者什么時(shí)候會(huì)實(shí)現(xiàn)?
我覺得我們已經(jīng)實(shí)現(xiàn)了,只是大家一直在改定義。圖靈測(cè)試?我們?cè)缇屯ㄟ^了。然后大家又說,AGI 需要在多個(gè)領(lǐng)域達(dá)到高中生水平?好了,現(xiàn)在也達(dá)到了。再后來變成「AGI 需要大學(xué)生水平」?這個(gè)也實(shí)現(xiàn)了。現(xiàn)在有人說,要在所有學(xué)科都達(dá)到博士水平,這才是 AGI。等到真的實(shí)現(xiàn)了,人們可能又會(huì)說:「不行,AGI 其實(shí)是要有『意識(shí)』。」其實(shí)大家真正想問的是:AI 什么時(shí)候會(huì)有自我意識(shí)?什么時(shí)候能像電影里那樣變得「覺醒」?但問題是,我不確定這種「意識(shí)」到底是不是神經(jīng)網(wǎng)絡(luò)到一定復(fù)雜度后自然涌現(xiàn)的東西。這其實(shí)是一個(gè)哲學(xué)問題。
Pat Grady:明白,那如果讓你推薦AI相關(guān)的內(nèi)容,不包括這個(gè)播客,你會(huì)推薦什么?
《Understand》(中文名《領(lǐng)悟),Ted Chiang(特德·姜)的小說。
我不想劇透,你自己去體驗(yàn)吧。Ted Chiang 是最偉大的科幻作家之一,他寫過《降臨》(電影原作)?!禪nderstand》是他 90 年代初寫的,完美展現(xiàn)了「智能指數(shù)級(jí)增長(zhǎng)」是什么感覺。大多數(shù)人可能會(huì)期待我推薦一本非虛構(gòu)書籍,比如去讀 Chinchilla 論文之類的。但如果你想真正理解,我們這個(gè)時(shí)代正在發(fā)生的事情,這本小說能從敘事角度捕捉到那種加速感。
Pat Grady:最后一個(gè)問題。你覺得AI在未來 20 年里最積極、最正面的影響會(huì)是什么?它會(huì)如何讓我們的生活變得更好?
我必須說,是「?jìng)€(gè)性化醫(yī)療」。個(gè)性化醫(yī)療一直是「明天的事」,就像量子計(jì)算、核聚變,感覺總是快實(shí)現(xiàn)了但又差點(diǎn)意思。不過實(shí)際上,我們剛才聊的 OpenEvidence,本質(zhì)上已經(jīng)是個(gè)性化醫(yī)療的起點(diǎn)了,比如針對(duì)某個(gè)病人特定的并發(fā)癥來推薦合適的生物制劑。但這只是冰山一角。
我認(rèn)為,再過 10 年,不管是 OpenEvidence 還是其他 AI,都會(huì)把病人的所有具體情況與全球所有相關(guān)醫(yī)學(xué)知識(shí)進(jìn)行匹配,形成一個(gè)超個(gè)性化的治療方案。到那時(shí)候,可能 120 歲、130 歲都不再是人類壽命的上限了。
然后我們就會(huì)進(jìn)入像忒修斯之船的哲學(xué)悖論:如果你不斷替換自己身體的「木板」,到最后你身體里沒有一塊是原來的了,但你的記憶、情感、身份都還在——那么,你還是你嗎?
我是個(gè)樂觀主義者,我相信人類生物學(xué)是可以被「拆解重建」的。我覺得,這種「忒修斯之船式的醫(yī)學(xué)」就在不遠(yuǎn)的未來。而 AI,正是推動(dòng)它實(shí)現(xiàn)的關(guān)鍵。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。
下一篇:電子病歷+醫(yī)療核心底座:金山云與宜昌市中心人民醫(yī)院聯(lián)合研發(fā)成果亮相——走進(jìn)宜昌,醫(yī)院“云數(shù)智”技術(shù)實(shí)踐研討會(huì)順利舉行
電子病歷+醫(yī)療核心底座:金山云與宜昌市中心人民醫(yī)院聯(lián)合研發(fā)成果亮相——走進(jìn)宜昌,醫(yī)院“云數(shù)智”技術(shù)實(shí)踐研討會(huì)順利舉行
前沿洞察 醫(yī)療大模型競(jìng)速賽打響!DeepSeek助力醫(yī)院信息化智慧升級(jí)
開創(chuàng)急診胸痛AI診療新紀(jì)元 潤(rùn)達(dá)攜手華為與齊魯醫(yī)院聯(lián)合發(fā)布”齊魯·心擎 急性胸痛大模型”
力匯智聯(lián)AI大模型智能導(dǎo)診機(jī)器人“亮晶晶”,在山西省眼科醫(yī)院正式上線億元戰(zhàn)略投資,深化骨科醫(yī)療產(chǎn)業(yè)布局
坐標(biāo)軟件iHealthOneGPT × DeepSeek融合創(chuàng)新,打造智慧醫(yī)療深圳新速度
醫(yī)用內(nèi)窺鏡耗材化趨勢(shì)已至,這家企業(yè)憑一次性宮腔鏡強(qiáng)勢(shì)入局 復(fù)星·星未來創(chuàng)業(yè)營(yíng)
AI醫(yī)療獨(dú)角獸OpenEvidence:1/4的美國(guó)醫(yī)生都在用,像互聯(lián)網(wǎng)產(chǎn)品一樣做AI醫(yī)療
電子病歷+醫(yī)療核心底座:金山云與宜昌市中心人民醫(yī)院聯(lián)合研發(fā)成果亮相——走進(jìn)宜昌,醫(yī)院“云數(shù)智”技術(shù)實(shí)踐研討會(huì)順利舉行
前沿洞察 醫(yī)療大模型競(jìng)速賽打響!DeepSeek助力醫(yī)院信息化智慧升級(jí)
開創(chuàng)急診胸痛AI診療新紀(jì)元 潤(rùn)達(dá)攜手華為與齊魯醫(yī)院聯(lián)合發(fā)布”齊魯·心擎 急性胸痛大模型”
力匯智聯(lián)AI大模型智能導(dǎo)診機(jī)器人“亮晶晶”,在山西省眼科醫(yī)院正式上線億元戰(zhàn)略投資,深化骨科醫(yī)療產(chǎn)業(yè)布局
坐標(biāo)軟件iHealthOneGPT × DeepSeek融合創(chuàng)新,打造智慧醫(yī)療深圳新速度
智慧醫(yī)療網(wǎng) ? 2022 版權(quán)所有 ICP備案號(hào):滬ICP備17004559號(hào)-5
6) sz = 6; startSz = sz; if (!(cEl = d.getElementById(trgt))) cEl = d.getElementsByTagName(trgt)[0]; cEl.style.fontSize = szs[sz]; for (i = 0; i
tgs.length; i++) {ctags = cel.getelementsbytagname(tgs[i]); for (j = 0; j