|


晴天霹靂,上周末AI圈突然傳出噩耗:商湯創(chuàng)始人湯曉鷗教授于2023年12月15日晚去逝。 現(xiàn)在媒體的口徑是“睡夢(mèng)中不幸離世”,原因有人說(shuō)是心梗,也有人說(shuō)是呼吸暫停癥狀。當(dāng)然,海外還有一堆人瞎造謠,都不可信。湯曉鷗教授最著名的身份是“AI四小龍”之一的商湯科技創(chuàng)始人,但他從2019年開(kāi)始就逐漸淡出了商湯的管理,精力更多放在教育和科研上。他今年只有55歲,說(shuō)一句英年早逝并不過(guò)分,AI圈者都在刷屏致哀。而且令人難過(guò)的是:類似的事兒去年發(fā)生過(guò)一次了。2022年6月,曠視科技的首席科學(xué)家孫劍也是突發(fā)疾病,搶救無(wú)效逝世,年僅45歲。曠視是“AI四小龍”中的另外一家,孫劍和湯曉鷗更是相熟多年。事實(shí)上,湯曉鷗最著名的一篇論文,就是2009年跟孫劍和何愷明一起合作發(fā)表的Single Image Haze Removal Using Dark Channel Prior。這篇論文是關(guān)于圖像去霧算法的,是計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)會(huì)議CVPR的2009年度最佳論文。這是CVPR歷史上第一次有中國(guó)團(tuán)隊(duì)獲獎(jiǎng)。 論文第一作者何愷明,是湯曉鷗在香港中文大學(xué)的博士生,也是孫劍在微軟工作時(shí)的實(shí)習(xí)生,他目前任教于MIT,學(xué)術(shù)成就甚至超越了兩位導(dǎo)師。 回望2009年的這篇論文,三個(gè)作者中有兩個(gè)已經(jīng)英年早逝,令人唏噓。 而且這些英年早逝,發(fā)生在AGI革命爆發(fā)、中國(guó)AI產(chǎn)業(yè)被部分封鎖、業(yè)界正在焦慮追趕的背景下,所以有好事者第一時(shí)間就跟陰謀論聯(lián)系在一起。 這兩天筆者跟很多從業(yè)人員聊起了湯曉鷗,發(fā)現(xiàn)他的分量的確極重,影響力難以復(fù)制。 在科學(xué)領(lǐng)域,他一手把香港中文大學(xué)MMLabs打造成全球人工智能重鎮(zhèn),而他自己也是計(jì)算機(jī)視覺(jué)領(lǐng)域的頂級(jí)科學(xué)家,論文被引13.9萬(wàn)次。 在政策領(lǐng)域,他是科技領(lǐng)域?yàn)閿?shù)不多能夠“上達(dá)天聽(tīng)”的學(xué)者。在2018年11月舉辦的民營(yíng)經(jīng)濟(jì)座談會(huì)上,湯曉鷗是10個(gè)發(fā)言的人之一。 在商業(yè)領(lǐng)域,他創(chuàng)辦的商湯曾經(jīng)是中國(guó)最耀眼的AI創(chuàng)業(yè)公司。盡管技術(shù)和商業(yè)化頻繁遭遇爭(zhēng)議,但目前市值仍然超過(guò)400億港幣。 所以,他的逝世是中國(guó)AI屆的巨大損失,影響難以估量。 但業(yè)界在討論湯曉鷗的“難以復(fù)制”時(shí),還不在上述的三點(diǎn)上,畢竟中國(guó)的企業(yè)家很多,科學(xué)家很多,轉(zhuǎn)型企業(yè)家的科學(xué)家也很多。 大家提到最多的,是湯曉鷗培養(yǎng)人才的模式,用一個(gè)朋友的話來(lái)說(shuō)就是:“在他的調(diào)教下,頂級(jí)人工智能人才如同流水線一般被錘煉出來(lái)。” 這位朋友給我扔給我一個(gè)網(wǎng)址頁(yè)面,來(lái)自湯曉鷗創(chuàng)辦的香港中文大學(xué)MMLab,上面記述了實(shí)驗(yàn)室所有已畢業(yè)校友的去向和履歷。 筆者翻完頁(yè)面上134名學(xué)生的履歷,筆者對(duì)湯曉鷗教授的重要性,有了更新的認(rèn)識(shí)。 
一路高光的履歷在解讀湯曉鷗如何培養(yǎng)人才之前,我們先來(lái)復(fù)盤一下他本人的經(jīng)歷,原因很簡(jiǎn)單:湯曉鷗自己的履歷,給未來(lái)的學(xué)生們打了一個(gè)模版。 由于長(zhǎng)期在香港任教,所以不少人以為湯曉鷗是一個(gè)香港人,但實(shí)際上他是一個(gè)地道的東北人,于1968年出生于遼寧鞍山。 湯曉鷗從小成績(jī)優(yōu)異,1985年畢業(yè)于當(dāng)?shù)刂攸c(diǎn)中學(xué)鞍山一中??赡苁鞘艿郊亦l(xiāng)工業(yè)重鎮(zhèn)的影響,湯曉鷗報(bào)考了中科大的精密機(jī)械與精密儀器系。 
年輕時(shí)的湯曉鷗 來(lái)源:B站up主xoooooooo 1990年本科畢業(yè)后,他前往美國(guó)羅徹斯特大學(xué)攻讀碩士,一年后,他申請(qǐng)到了麻省理工學(xué)院的博士項(xiàng)目,專業(yè)是應(yīng)用海洋科技(Applied Ocean Science and Engineering)。 這個(gè)博士項(xiàng)目,是由MIT和世界著名的海洋研究機(jī)構(gòu)伍茲霍爾海洋研究所(Woods Hole Oceanographic Institution,簡(jiǎn)稱WHOI)聯(lián)合培養(yǎng)。 
伍茲霍爾海洋研究所,馬薩諸塞州 這個(gè)研究所位于麻省南部,距離MIT的校園一個(gè)半小時(shí)車程。在1985年,正是伍茲霍爾研究所設(shè)計(jì)的機(jī)器人,找到了沉在海底的泰塔尼克號(hào)。 也是在這里,湯曉鷗發(fā)表了大量跟聲納和圖像識(shí)別相關(guān)的論文和報(bào)告。  在后來(lái)的公開(kāi)發(fā)言中,湯曉鷗說(shuō)這是他對(duì)人工智能開(kāi)始產(chǎn)生濃厚興趣的起點(diǎn),尤其是當(dāng)他看到機(jī)器人使用聲納和攝像頭在海底自由地探索時(shí)。
WHOI潛水機(jī)器人 Jason Jr.探索泰坦尼克號(hào), 1986年 1996年博士畢業(yè)后,湯曉鷗前往香港中文大學(xué)任教,2001年他創(chuàng)辦了香港中文大學(xué)多媒體實(shí)驗(yàn)室(MMLab),主攻計(jì)算機(jī)視覺(jué)。 這一實(shí)驗(yàn)室如今也被認(rèn)為是商湯科技的前身。 此時(shí)計(jì)算機(jī)視覺(jué)雖在國(guó)際上有廣泛討論,但在香港屬于徹頭徹尾的“前沿技術(shù)”,基本相當(dāng)于當(dāng)年奧本海默回美國(guó)開(kāi)設(shè)量子力學(xué)課。 沒(méi)有成熟的學(xué)術(shù)圈,就意味著這個(gè)實(shí)驗(yàn)室既吸引不到學(xué)生,又拿不到研究經(jīng)費(fèi),更何況在香港,優(yōu)秀的本地學(xué)生去美國(guó)深造早已成為共識(shí)。 但很快,湯曉鷗就想到了一套解決方法——從內(nèi)陸招生。 第一個(gè)生源地就是母校中科大。通過(guò)自己的接觸和校友的介紹,湯曉鷗很快就挖掘到了王曉剛、陶大程、林達(dá)華、曹亮亮等優(yōu)秀學(xué)生。 湯曉鷗從科大招的第一個(gè)學(xué)生是王曉剛,后來(lái)不僅成了他的妹夫,還跟他一起創(chuàng)立了商湯。 
商湯科技研究院院長(zhǎng)王曉剛 2005年,湯曉鷗開(kāi)始在微軟亞洲研究院(MSRA)兼職。微軟亞洲研究院位于北京市海淀區(qū),最不缺的就是來(lái)自清華北大的實(shí)習(xí)生。 通過(guò)這個(gè)途徑,他進(jìn)一步拓展了生源,邀請(qǐng)優(yōu)秀的年輕人前往MMLab訪學(xué)或者求學(xué),如何愷明,顏水成,徐東,崔靖宇等人。 解決了生源問(wèn)題,下面就應(yīng)該解決培養(yǎng)問(wèn)題了。港中文MMLab后來(lái)被稱為“中國(guó)計(jì)算機(jī)視覺(jué)的黃埔軍?!?,必定有一套獨(dú)特的培養(yǎng)體系。 這套體系的核心密碼,就在于四個(gè)字——頂級(jí)會(huì)議。 
勇攀頂級(jí)會(huì)議先普及下計(jì)算機(jī)視覺(jué)領(lǐng)域的三大頂級(jí)會(huì)議:CVPR、ICCV和ECCV。CVPR全稱是“計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議”,每年舉辦一次,基本都在美國(guó),偶爾也去其他地方,論文接受率大概是20~30%。ICCV全稱是“計(jì)算機(jī)視覺(jué)國(guó)際會(huì)議”,每?jī)赡昱e辦一次,地點(diǎn)全球流動(dòng),比如19年在首爾,21年停辦,今年在巴黎,論文接受率也在20~30%。ECCV全稱是“歐洲計(jì)算機(jī)視覺(jué)會(huì)議”,每?jī)赡昱e辦一次,跟ICCV錯(cuò)峰,舉辦地點(diǎn)主要在歐洲,不過(guò)去年在特拉維夫,接收率跟上面兩個(gè)差不多。計(jì)算機(jī)科學(xué)由于發(fā)展速度快,所以學(xué)術(shù)大牛會(huì)優(yōu)先選擇把成果發(fā)在會(huì)議上,而不是出版周期長(zhǎng)的期刊。因此計(jì)算機(jī)的學(xué)術(shù)影響力,就看頂會(huì)。比如CVPR,在最新的Google學(xué)術(shù)出版物的排名中,CVPR只排在Nature、新英格蘭醫(yī)學(xué)和Science之后,在柳葉刀之前,高居第四位。從2001年成立開(kāi)始,湯曉鷗就把這些頂級(jí)會(huì)議,設(shè)置成了學(xué)生們的標(biāo)靶。雷鋒網(wǎng)的一篇報(bào)道描述了這種氛圍:“以頂會(huì)'死亡線’(Deadline)為目標(biāo)制定科研規(guī)劃,在投稿前熬夜備戰(zhàn)沖刺,并且閱讀大量的科研論文?!?/span>湯曉鷗的學(xué)生也非常給力。在他的指導(dǎo)下,王曉剛在碩士?jī)赡昀锇l(fā)表了5篇CVPR和ICCV論文,林達(dá)華則在兩年里發(fā)表了7篇頂會(huì)論文。
香港中文大學(xué)教授林達(dá)華 最終,這些頂會(huì)論文成了更高舞臺(tái)的敲門磚:王曉剛和林達(dá)華碩士畢業(yè)后都去了麻省理工學(xué)院攻讀博士,兩人后來(lái)都回到了MMLab執(zhí)教。從港中文碩士走向麻省理工博士的還有薛天帆(本科清華,現(xiàn)香港中文大學(xué)教授)和周博磊(本科上海交大,現(xiàn)UCLA助理教授)等人。周博磊回憶自己的第一篇頂會(huì)論文時(shí)說(shuō)道[3]:我在2010年八月一進(jìn)實(shí)驗(yàn)室就悶頭苦干三個(gè)月,順利在十一月份提交了自己在湯老師和曉剛老師指導(dǎo)下的第一篇論文,也成為了我的第一篇CVPR論文。從此初出茅廬,開(kāi)始了我在計(jì)算機(jī)視覺(jué)領(lǐng)域的探索。而更多潛在的生源,被這樣的案例所吸引,越來(lái)越多的優(yōu)秀學(xué)生加入MMLab,實(shí)驗(yàn)室形成了培養(yǎng)人才的正向循環(huán)。湯曉鷗認(rèn)為沖擊頂會(huì)是在跟全球的同行競(jìng)技,他把做研究比做“論劍”,認(rèn)為“要論就要到華山論劍,不要去太行山、大別山論劍?!?/span>另外,他還非常重視原創(chuàng)研究。在灌水論文橫行的當(dāng)下,港中文MMLab的論文質(zhì)量很高,多次拿到頂級(jí)會(huì)議的“最佳論文”稱號(hào)。2009年,港中文MMLab和微軟亞洲研究院合作的論文奪得了當(dāng)年CVPR的最佳論文獎(jiǎng)(本文開(kāi)頭提到的那一篇),MMLab的江湖地位驟然提升。
湯曉鷗和何愷明, 2010年 2010年后,湯曉鷗將目光逐漸轉(zhuǎn)向深度學(xué)習(xí)。在2011年到2013年期間,MMLab在ICCV和CVPR兩大頂會(huì)上發(fā)表了14篇深度學(xué)習(xí)論文,占比超過(guò)一半。而在商湯成立(2014年)之后,“卷論文”的傳統(tǒng)也從香港帶到了上海。2018年湯曉鷗在一場(chǎng)發(fā)布會(huì)上公布了一個(gè)數(shù)據(jù):過(guò)去幾年全球各類機(jī)構(gòu)在頂級(jí)計(jì)算機(jī)視覺(jué)學(xué)術(shù)會(huì)上發(fā)布的論文數(shù)量排行中,商湯位列第三,僅次于微軟和卡耐基梅隆大學(xué)。擁有頂會(huì)論文的加持,湯曉鷗學(xué)生的職業(yè)路徑顯然也是頂級(jí)的。
黃埔軍校,實(shí)至名歸我們統(tǒng)計(jì)了香港中文大學(xué)MMLab的134名畢業(yè)校友的去向,發(fā)現(xiàn)大致可以分為三類。
第一類方向是高校,根據(jù)統(tǒng)計(jì)有50名畢業(yè)校友去了高校擔(dān)任教職,最高的自然是麻省理工,最低的也至少是國(guó)內(nèi)211/985高校。 第二類方向是企業(yè),有84位學(xué)生選擇去了科技公司,人數(shù)最多的自然是商湯,有18名校友追隨湯曉鷗的創(chuàng)業(yè)。其他去企業(yè)的學(xué)生也進(jìn)的也都是頂級(jí)科技公司,比如華為(6人)、騰訊(6人)、Google(3人)、微軟(4人)以及Meta(3人)等。第三類方向是研究機(jī)構(gòu),如上海人工智能實(shí)驗(yàn)室和深圳先進(jìn)技術(shù)研究院等,其中有6名學(xué)生加入了湯曉鷗主持的上海人工智能實(shí)驗(yàn)室,另外至少還有5名校友在這所實(shí)驗(yàn)室里兼職工作。在這些校友中,我們挑選了比較有代表性的一部分人,履歷如下所示。
在前往高校的校友中,有相當(dāng)一部分人已經(jīng)自己成為碩導(dǎo)或者博導(dǎo),如王曉東、林達(dá)華、趙峰、王利民等,為中國(guó)AI行業(yè)培養(yǎng)出更多的人才。 而何愷明則是湯曉鷗為全人類培養(yǎng)的人才。用一位業(yè)內(nèi)人士的話來(lái)說(shuō):“僅憑ResNet,何愷明就在人工智能的史書(shū)上擁有名字了?!?/span>何愷明的發(fā)表的論文“只有”69篇,但引用量就高達(dá)51.2萬(wàn)次。他加入麻省理工之后,馬上就成了MIT被引用次數(shù)最多的科學(xué)家。
何愷明文獻(xiàn)和引用統(tǒng)計(jì),Google Scholar 林達(dá)華在悼念湯曉鷗時(shí)寫(xiě)道[2]:湯老師的一生,傾盡心血,就是要為年輕一代的學(xué)者創(chuàng)造一個(gè)成長(zhǎng)的空間,為國(guó)家也為全世界培育原創(chuàng)的力量。從MMLab、商湯、到上海人工智能實(shí)驗(yàn)室,都是他為年輕人打造的一個(gè)個(gè)成長(zhǎng)的舞臺(tái)。 在2023年的世界人工智能大會(huì)上,湯曉鷗做主題發(fā)言,他沒(méi)有講產(chǎn)業(yè)趨勢(shì),沒(méi)有講前沿突破,而是講述了三個(gè)學(xué)生——王曉剛、何愷明、林達(dá)華——的成長(zhǎng)故事。這充分說(shuō)明了一件事情:在他心里,學(xué)生才是最令他珍視的。
壯志未竟的事業(yè)
從2019年之后,湯曉鷗的精力就主要放在了一家新成立的機(jī)構(gòu)——上海人工智能實(shí)驗(yàn)室上。目前在UIUC任教的曹亮亮回憶: 上次回國(guó)跟湯老師聊天,我就傻乎乎的問(wèn)他,即然商湯已經(jīng)不需要太多精力了,為什么不休息或者退休,為什么要付出那么多力氣去搞上海AI Lab。曉鷗說(shuō)我們一直要瞄準(zhǔn)最高水平,這樣才有能力去改變這個(gè)社會(huì)。使命驅(qū)動(dòng)著湯曉鷗,而大量出身MMLab的學(xué)者則追隨他的腳步,加入了這家新成立的實(shí)驗(yàn)室,如喬宇、歐陽(yáng)萬(wàn)里、侯躍南、王佳琦、高鵬、邵文琪、呂照陽(yáng)、龐江淼等。  在今年6月,上海人工智能實(shí)驗(yàn)室聯(lián)合武大、商湯的關(guān)于自動(dòng)駕駛通用模型的論文,從9155篇作品中脫穎而出,獲得CVPR 2023年最佳論文獎(jiǎng)。而論文的牽頭作者,是湯曉鷗的學(xué)生王曉剛帶出來(lái)的博士——湯曉鷗傳承的第三代已經(jīng)獨(dú)當(dāng)一面,這離MMLab的成立也已經(jīng)20多年。 但命運(yùn)的休止符,落在了這個(gè)格外寒冷的冬天。在AI浪潮席卷而來(lái)之時(shí),中國(guó)人工智能領(lǐng)域還要在焦慮和追趕中繼續(xù)前行。只是湯老師的課已經(jīng)提前結(jié)束了。老師再見(jiàn)。全文完。  [1] 致敬湯曉鷗:將港中文建成中國(guó)計(jì)算機(jī)視覺(jué)黃埔軍校,陳彩嫻、黃楠,雷鋒網(wǎng)[3] 商湯科技創(chuàng)始人湯曉鷗睡夢(mèng)中離世,你對(duì)他有哪些記憶?知乎
|