萬字長談王小川:不再迎合他人做學霸,我要解自己的命題
日期:2025-08-18 19:32:24 / 人氣:55

從小就是 “學霸” 的王小川,其實不太喜歡自己的 “學霸” 標簽。他在離開搜狗后的一次交流里,和極客公園創始人 & 總裁張鵬講過自己的看法:“學霸” 的另一面,意味著在別人設定好的命題里取得 “高分”,但他接下來其實想找到自己的命題,不想再做別人命題里的學霸了。
ChatGPT 的爆發,帶著大模型浪潮撲面而來,王小川自己和所有熟悉他的人,都覺得他是最適合 AI 時代的中國創業者之一。故事似乎和之前一樣,王小川成立百川智能符合所有人的期待,然后就是響亮的 AI 六小虎的稱號,以及大家在模型評分榜上的位置,產品 MAU 的數據、商業化 ARR 數字,等等。看起來王小川還是繞不開大家對于 “學霸” 的期待,有一堆必答題要去回答。
王小川自嘲,一度自己覺得百川成了三個公司:一個做模型,一個做 toB 商業化,一個做 AI 醫療。而王小川內心真正想做的,并非市場所期待的通用模型問題,而是 “為人類造醫生,為生命建模型。”
王小川一度覺得這個命題,在迎合更多業界必答題的過程中,從原點變成了 “遠方”,這讓他覺得很有問題。這種撕扯,最終以今年 4 月開始的大調整而和解。王小川做出了選擇:團隊從 450 人精簡至不足 200 人,回歸扁平,回歸專注。人數少了,團隊的 “壓強” 反而上去了,這讓他對于未來,也更有底氣和信心。
外界猜測這是 “遭遇困境” 后的被動收縮,唱衰百川的各種報道滿天飛,這可能是王小川創業這么多年來被負面新聞包裹得最緊的一次。但是王小川本人選擇沉默、完全沒有回應。按照他的原話是 “我需要的是跟自己的內心做斗爭,而不是跟環境做斗爭”。
直到 8 月 12 日,當王小川帶著百川全新的醫療大模型 Baichuan-M2 亮相后,外界才終于看懂了他沉默的這幾個月在做什么。這款大模型的性能超過了 OpenAI 新近發布的兩個開源模型;而在閉源領域,它的能力也僅次于 GPT-5。但這還不夠。對王小川而言,他的目標,是在醫療這個垂直領域,實現對通用模型的超越。
這個時候,百川感覺上才真正變回了 “一家公司”,而王小川也終于結束 “一言不發”,愿意坐下來和張鵬再次進行一場長談。
這更像是一次坦誠的復盤,一次對過去兩年喧囂的總結。也是一次對上半年不少朋友 “小心翼翼” 的關心和擔心的回應。王小川覺得他現在的狀態很好,因為他不再需要回答別人強加的必答題,而是可以真正定義自己的問題,并給出他更銳利的答案。
以下為王小川與張鵬對話內容實錄,有編輯刪減。
“智能的高度” 與 “應用的深度”
張鵬:最近 GPT-5 終于發布了,我們曾想象它會再次引領產業的大飛躍,但世界給予的反饋,似乎并不符合這個版本應該有的震撼。現在大家探討 AIcoding 的熱情、以及感嘆 Anthropic 估值已經接近 2000 億美金的熱情似乎更高漲,你怎么看這些現象?
王小川:這可能是美國激烈競爭格局下的必然結果。畢竟那邊牌桌上還有 Grok、Anthropic 等強勁的對手。值得注意的是,AI coding 確實也呈現了一個可能比 ChatGPT 擁有更好商業模式和數據飛輪的通向 AGI 的通道。
很可能,今天 OpenAI 正處于一個相對劣勢的階段,在競爭壓力下顯得有些倉促地發布了產品。所以,給人感覺有點 “拉下神壇” 了。但我覺得這不代表 OpenAI 就此沉寂,更不意味美國 AI 創新后繼無人。恰恰相反,這證明了其他競爭者的實力,他們正在激烈地爭奪王座。
張鵬:我們該如何理解這種現象?OpenAI 有做錯了什么嗎?
王小川:從技術路線圖來看,我從一開始就更欣賞 Anthropic 的策略,尤其是它將代碼作為發展的中心,這條路是以 API 為中心,特別是深耕代碼能力。語言模型強化到代碼層面,就能夠賦能千行百業。
而 OpenAI 選擇是把重心放在一個 C 端的 App 上,最初由 Ilya Sutskever 提出的 “predict next token”(預測下一個詞元)開啟了大模型范式,沿著這條路走下去,代碼本應是可見的、必然的方向。但或許是因為 OpenAI 的 “包袱” 過重,什么都想要,反而無法專注,也就難以找到最關鍵的軸心去突破。
當它需要服務 7 億用戶時,就無法將代碼置于足夠高的戰略位置。我認為這是一種路線圖上的風險。
我心中的 AGI(通用人工智能),其核心是代碼能夠自動運行。對此我有兩個邏輯:一個是從產業應用場景出發,例如造醫生;但從更極致的技術追求來看,代碼才是中心。
因此,無論從產品形態還是技術路線圖來看,OpenAI 都沒有走在我期望的路徑上。
張鵬:Anthropic 的估值已經漲到了 1700 億美元。我記得你每次都會強調,“語言才是智能的中軸”。所以 “代碼語言” 這個軸線上的高速發展已經開始了唄?
王小川:代碼,本質上就是一種更高級的語言。
最近 Geoffrey Hinton 也開始講,人類智力的核心在于 “類比”。這正是我一直信奉的,語言的本質就是類比與推理。我之前反復推薦侯世達的《表象與本質》,那本書用完整的篇幅闡述了這件事。
因此,數學是語言,代碼也是語言,而且是一種 “可運行” 的語言。它就像圖靈機一樣,能夠解決萬千問題。所以,真正的道路是清晰的:首先,通過人類語言理解常識、學會溝通;然后,掌握數學語言與代碼語言,從而征服理科與工科。這條路,我過去在很多場合都講過,從未改變。
今天代碼的快速崛起已經開始驗證其價值,更重要的是它的數據飛輪也已經高速啟動了。
其實代碼的終極用法,不是輔助程序員,而是它自己就能運行。今天所有類似的 Cursor 工具,本質上還是在輔助程序員。而一旦代碼能夠實現自我運行,AGI 也就到來了。我還記得多年前在知乎寫過一個帖子,標題是:“程序員是自己的掘墓人”。現在,這句話正在被驗證。
張鵬:以前大家對 “智能的高度” 特別充滿熱情,每次新模型的屠榜跑分都會被認真討論很久,但感覺今天 Coding 帶來了一個 “應用的深度” 和 “智能的高度” 可以一起前進的事情。未來 “應用的深度” 是不是會變得更被重視?
王小川:沒錯。單純的評測已經不夠,已經到了可應用的階段。
其實除了代碼的價值已經肉眼可見,今天大家對醫療的期待,也是與日俱增的。國內大家討論得偏少,但其實醫療正迅速從 “非共識” 走向 “共識”。盡管 Anthropic 在代碼領域跑得更快,但 OpenAI 在今年 5 月發布了 Health-Bench,把醫療健康納入核心評測維度。在 OpenAI 的產品發布會上,“健康” 與 “醫療” 被反復強調。甚至在發布開源模型時,技術報告開篇第一章,就是闡述它在醫療領域的進展。
最值得玩味的,是在 GPT-5 的發布會上,唯一被請上臺為它背書的,是一位癌癥患者。
OpenAI 身負著服務 7 億用戶的巨大 “包袱”,這迫使它必須超越純粹的技術敘事,走向一條 “以人為中心” 的路線。在這條路上,醫療是其無法回避,且必須占領的戰略高地。
張鵬:硅谷確實還在越來越熱鬧,但過去一段時間,大家都覺得國內大模型領域許多備受矚目的創業公司,也包括百川智能,似乎都變得 “安靜” 了。這背后有什么共性原因嗎?
王小川:身在局內,我反而覺得這是一個極其自然的過程。
2023 年是歷史性的一年,資本的恐慌性涌入和對未來的無限暢想,是技術變革的必然序曲。這有點像 Gartner 技術成熟度曲線的規律,當期望膨脹到頂峰,現實與應用之間的距離必然會導致一個調整期。當人們發現技術突破未能立即轉化為應用爆發,熱情冷卻,行業便會安靜下來重新思考。
回答這個問題,必須從技術與環境兩個層面來看。技術層面,如果大家研究下 OpenAI 最新的開源模型,會發現它在基礎設施與工程化上的深厚實力,這不僅關乎算法。我們一度以為已經拉近的距離,現在又被重新拉開。我們期待國內同行在底層架構上持續追趕,而百川也會在醫療這樣的垂直領域,做出自己的貢獻。
然而,比技術差距更嚴峻的,是來自大環境的挑戰。美國頭部公司動輒百億美金的融資,以及像 Anthropic 年化經常性收入(ARR)已接近百億美金的規模,這在國內目前都難以想象。說實話,在這樣的牌局里,任何一家能夠 “咬住” 不掉隊,本身已是一件了不起的事情。
本質上,我們和美國存在一個 “時間差”。當他們已經進入以 ARR 為核心的 “摘果子” 收獲期時,我們絕大多數人還身處圍繞基準測試(Benchmark)和參數的 “模型內卷” 階段。這種階段上的錯位,會直接導致 “底氣” 的缺失。
張鵬:這種 “看 ARR” 與 “看參數” 的差異,根源在于技術,還是商業環境?
王小川:我認為是雙重疊加:既有技術追趕的壓力,也源于商業土壤的不同。
張鵬:那之前大家在模型上投入的熱情和資源,你覺得值得嗎?如果這是一場如此艱難的追趕?
王小川:我認為,這取決于一家公司的終極抱負。
如果你的目標是打造一個輕巧、敏捷的公司,那么完全可以不自研模型。比如一個十幾人甚至幾個人的小公司,通過調用最優的第三方模型,完全有可能快速實現正向現金流,并獲得資本的青睞。
但如果你立志要成長為一個長期的、具有系統性影響力的大公司,那么在模型層面的自主積累,就是一件不可或缺的事情。
重新變回一家 “有自己命題的公司”
張鵬:最近投資圈都在 “感謝” 大模型公司 “釋放了很多優秀人才”,讓他們看到了不少值得投,值得搶的新項目。百川的業務和人員調整好像也挺大的,這背后你是怎么想的?
王小川:你肯定還記得 2023 年百川當時的策略就是 “快”。快速入場、快速融資、快速搶占技術身位。這讓我們在高峰期一度達到 450 人。速度為我們贏得了有利位置,但也帶來了 “思想無法統一” 的后遺癥。
許多人帶著對大模型的熱情,甚至是源于 FOMO 的恐懼,加入了百川,我們卻未能真正 “捏成一股繩”。公司內部甚至自嘲,已經分裂成了做模型、做醫療、做商業化 “三個公司”。
后來,我在全員信中也坦誠溝通了這件事:我們必須回歸創業的初心 ——“為人類造醫生,為生命建模型”。
所以最近在組織上確實做了很多調整,直接說結果就是從 450 多人變成了不到 200 人,然后我們把管理層級從平均 3.6 級壓縮至 2.4 級,從今年 4 月到 6 月,花了兩個多月,我們完成了這次調整。你會發現,人數少了,整個團隊的 “壓強” 反而上去了,這讓我對未來更有底氣。我感到非常高興的是,最終留下的,是一支既有 AI 信仰,又對醫療抱有熱忱的團隊。
張鵬:當初的快速擴張,在多大程度上是被客觀的產業節奏裹挾?又在多大程度上,是因為自己主觀上沒控制好節奏?
王小川:我認為是 “三七開”—— 三分客觀,七分主觀。
客觀上,在當時那個狂熱的時間點,想要完全抵抗住浪潮的推力,確實很難。但更深層的原因,在于我自己。我確實為了迎合媒體、迎合團隊、迎合外界的期待,做了很多 “多余的動作”。
比如,我對金融這類能快速變現的方向,內心并無真正的熱情。但當時有團隊想做,有股東感興趣,我就 “從” 了。現在回看,這本質上是自己當時的 “心力” 還不夠強大。而攤子鋪得越大,心力被稀釋得就越厲害。
張鵬:現在想想的話,當時有辦法更好地避免這種問題嗎?
王小川:我還真反思過,而且可能解法還真沒那么復雜。比如當時如果我能堅持面試每一位新同事,情況會好很多。因為這個過程中就一定會讓自己 “慢下來”、想清楚。創業者一旦只判斷和選擇目標,而不充分參與過程之痛苦,很多判斷就會出問題。
我看其實大家的節奏調整都差不多,我相信行業會回歸理性,大家也終將更專注于自己真正想做的事。
對我而言,這次調整最大的收獲,是未來變得前所未有的清晰。因為我終于明白,真正的斗爭,從來不是與環境的斗爭,而是與自己內心的斗爭。
張鵬:前段時間因為這些調整負面報道滿天飛的時候,是不是有好多朋友給你打電話慰問?
王小川:慰問是有的。但大家似乎都有些小心翼翼,大都不敢打電話,反正就是各種謹慎小心的關心我,說的問的都挺含蓄。
張鵬:你覺得大家為什么要來小心翼翼的 “慰問” 你?或者說他們為你擔憂的是什么?
王小川:估計是覺得我壓力大。之前,無論對我,還是對百川,外界都抱有某種期待。當百川的發展軌跡,沒有完全符合大家想象中那種高歌猛進的劇本時,可能一種低于預期的感受便產生了。我內心很清楚,媒體曾經給予了多少贊譽,當現實與預期出現偏差時,外界就會感受到同等程度的 “失望”。
張鵬:所有的媒體贊揚,本質上都是一種 “預支的借款”。
王小川:特別對。要么是消耗過往積攢的信譽,要么是透支未來的承諾,但終究是要 “償還” 的。所以,外界的情緒,本質上是與你的發展速度和最終成績緊密掛鉤的。
張鵬:在那段時間里,你本人真實的狀態是怎樣的?
王小川:說實話,我確實沒有焦慮。我非常感謝大家的關心。很多人曾將自己對技術的理想,部分投射在了我們身上。所以當百川的路徑看似 “偏離” 時,那種失落感是真實存在的。
而我之所以不焦慮,是因為我看到了大家沒看到的東西。
大家期待的百川,和我內心真正想構建的百川,其實存在一個錯位。早在 2021 年,甚至在創立百川的公開信里,我就明確提出,我未來二十年的熱情在于生命科學和大眾健康。ChatGPT 的出現,只是讓實現這一目標的路徑變得更加清晰和可行。
但在 2023 年那個時間點,整個市場都沉浸在一種狂熱里。無論是投資人、媒體,還是團隊成員,他們都帶著美國最前沿的模式作為對標,希望你做的跟美國一樣,因為那是被驗證過的、成功率最高的路徑。
在那種氛圍下,你去談醫療,是很難被聽進去的。所以,我們當時在某種程度上 “迎合” 了市場的期待,沿著大家都能看懂的 “共識” 路徑在走。
但當我們的探索開始深入,逐漸回歸到醫療的時候,之前那些因大模型、AGI 加入的人,都會產生一種跟期待不一致的地方。
而百川在過去一年里完成的最重要的一件事,就是經歷調整,真正回歸到了我們自己對于未來的 “意義感” 和核心驅動力上。
張鵬:你真實 “第一人稱視角” 的投身大模型領域的起心動念是什么?我很好奇在過去的幾年間,為什么沒有去調整大家對你們的認知錯位呢?
王小川:當我決定下場時,是因為我真切地感受到了 “模型” 的力量。2023 年初,我第一次深度使用 ChatGPT 時,內心有兩種強烈的沖擊。
第一種,震撼。因為我之前專注于醫療領域,對最前沿的技術進展沒有那么緊密地追蹤。一上手,我心里就咯噔一下,意識到:天變了。我過往做輸入法、做搜索,每天都在和語言 AI 打交道,所以我能清晰地判斷,眼前的這個東西,和過去完全不是一個物種。
第二種,隨之而來的是一種失落感。我曾經也算是 AI 圈的中心人物,但那一刻,我發現自己想做的醫療事業,似乎與 AI 的主旋律,變成了兩條平行線。
后來,我很快就想明白一個事:今天的大模型,能不能被用來 “造醫生”?
這個想法,讓我內心的兩條邏輯線索瞬間串聯了起來:
第一條邏輯:語言是智力的中軸。掌握了語言,就掌握了構建智能、乃至 “造人” 的關鍵。
第二條邏輯:醫生是醫療的中軸。構建了 “AI 醫生”,就能掌握用戶、藥廠和科研的樞紐。
所以,技術上,我們在 “造人”;應用上,我們則是在 “造醫生”。因此,我們從基礎模型做起,因為你不可能依賴一個不開源的外部模型,去構建你的核心壁壘。
我的計劃始終是,超級模型里要走到 AGI,超級應用則要去 “造醫生”。但問題是,當時你向外界講述這個 “超級應用” 時,大家聽不進去,他們只能聽懂,或者說更愿意聽 “超級模型” 的故事。
到了 2024 年,我們意識到,以百川的資源和國內的整體
作者:杏耀注冊登錄測速平臺
新聞資訊 News
- 科學是如何淪為了大國博弈的棋子...11-23
- 大疆“密會”投資機構:不提上市...11-23
- 奧特曼都點贊,谷歌Gemini 3 P...11-23
- 吉爾莫·德爾·托羅《弗蘭肯斯坦...11-23

