開欄語
當(dāng)人工智能的浪潮席卷全球,北京正以科技創(chuàng)新之姿,成為AI大模型領(lǐng)域的戰(zhàn)略高地。從智源研究院的“悟道”大模型問世,到“天使投資人”模式孵化頂尖學(xué)者,再到月之暗面、DeepSeek、智譜等人工智能獨(dú)角獸崛起,這座城市不僅匯聚了前沿技術(shù),更以開放生態(tài)孕育突破性成果。
如今,北京正積極打造“全球開源之都”,一大批研發(fā)機(jī)構(gòu)、企業(yè)積極擁抱開源,而開源也已深入到汽車、機(jī)器人等眾多行業(yè)。發(fā)展AI將是一場科技長征,在北京市科委、中關(guān)村管委會(huì)的支持和推動(dòng)下,新京報(bào)AI研究院推出“AI浪潮錄”系列專欄,深度訪談此次AI浪潮的親歷者與見證人,講述AI競爭新格局與背后的故事。
清程極智聯(lián)合創(chuàng)始人師天麾。受訪者供圖
人工智能是年輕的事業(yè),也是年輕人的事業(yè)。
清程極智聯(lián)合創(chuàng)始人師天麾正成為這句話的一個(gè)生動(dòng)的注腳,而他的經(jīng)歷也是當(dāng)前中國年輕一代AI高端人才的縮影——高中拿下信息學(xué)奧林匹克競賽金獎(jiǎng)保送清華大學(xué),大學(xué)確定了系統(tǒng)和高性能計(jì)算的研究方向,博士畢業(yè)后成為中國科學(xué)院計(jì)算技術(shù)研究所課程講師、中國信通院萬卡智算集群服務(wù)能力推進(jìn)方陣技術(shù)專家。
多個(gè)身份標(biāo)簽加持,互聯(lián)網(wǎng)大廠曾向師天麾拋出高薪的橄欖枝,他最終卻選擇自己創(chuàng)業(yè),理由也很簡單,“做一些不同的事”。在他眼中,大廠“老板安排”和KPI均是束縛,創(chuàng)新將難以開展。
在AI圈,年輕的身影已然顯眼。2024年異軍突起的Kimi由90后楊植麟領(lǐng)軍,2025年席卷全球的DeepSeek核心團(tuán)隊(duì)成員為清北的應(yīng)屆畢業(yè)生組成。根據(jù)獵聘大數(shù)據(jù)研究院報(bào)告,近一年AI技術(shù)活躍人才中,30歲以下的人才占比59.90%。
如今,創(chuàng)立一年多時(shí)間,清程極智已同時(shí)入駐上?!澳K倏臻g”和北京“人工智能創(chuàng)新街區(qū)”,這個(gè)清華系A(chǔ)I Infra(人工智能基礎(chǔ)設(shè)施)創(chuàng)新企業(yè),員工平均年齡不到30歲。
作為一名95后,師天麾的身上看不到老一輩人心中那座名為“技術(shù)差距”的大山。面對新京報(bào)AI研究院關(guān)于算力、創(chuàng)新等問題時(shí),師天麾坦言,英偉達(dá)從建立起CUDA到很多人用,其實(shí)也沒有很久。國產(chǎn)芯片只要解決好更好用的問題,以國內(nèi)的工業(yè)制造能力,將以超高性價(jià)比在競爭中勝出。
他所在的這支由清華計(jì)算機(jī)系師兄弟組建的團(tuán)隊(duì),既是中國AI新生代的典型樣本,也是破解國產(chǎn)算力短缺的探路者,開源的大模型推理引擎“赤兔”通過底層技術(shù)革新,實(shí)現(xiàn)了大多數(shù)老舊英偉達(dá)GPU和國產(chǎn)芯片對原生FP8模型的高效部署,從而能夠運(yùn)行DeepSeek滿血版。當(dāng)全球AI競賽進(jìn)入算力攻堅(jiān)階段,年輕團(tuán)隊(duì)正在為國產(chǎn)芯片與大模型之間架起一座“通天塔”,在英偉達(dá)主導(dǎo)的算力版圖中撕開一道創(chuàng)新裂縫。
創(chuàng)業(yè)·代碼寫得特別快的愉悅
新京報(bào)AI研究院:你最早接觸AI是什么時(shí)候,為何選擇了這個(gè)行業(yè)?
師天麾:我最早接觸AI要追溯到初高中加入信息學(xué)奧林匹克競賽小組的時(shí)候,當(dāng)時(shí)的學(xué)習(xí)內(nèi)容主要為“算法和數(shù)據(jù)結(jié)構(gòu)”。之所以學(xué)習(xí)奧賽,主要是對計(jì)算機(jī)感興趣,還能偷偷打游戲。高二的暑假,我獲得了2014全國青少年信息學(xué)奧林匹克競賽金牌,保送了清華大學(xué)計(jì)算機(jī)系。
在我的大學(xué)期間,人工智能已經(jīng)迎來了以智能駕駛和CV(計(jì)算機(jī)視覺)為主的第一波浪潮,大二時(shí),我還沒想好將來是就業(yè)還是從事科研,于是去了智能駕駛企業(yè)Momenta實(shí)習(xí)研究算法。經(jīng)過工作實(shí)踐,我發(fā)現(xiàn)人工智能算法的“黑箱”特性導(dǎo)致可解釋性不強(qiáng),這無法給我很高的成就感。大三時(shí),我去商湯科技的高性能計(jì)算部門進(jìn)行了嘗試,才找到了自己真正的興趣所在。
實(shí)際上,信息學(xué)奧林匹克競賽本身就對程序運(yùn)行的時(shí)間有要求,這也讓我對“把一份代碼寫得特別快”很感興趣,最終我成為清華大學(xué)高性能計(jì)算研究所翟季冬老師的博士。在博士研究過程中,多年積累也為創(chuàng)業(yè)提供了條件。2023年,我們清程極智成立,主要以清華計(jì)算機(jī)系高性能計(jì)算所的師兄弟為班底,清程主要做AI Infra。
簡單來講,AI Infra是連接硬件與AI算法之間的“中間層”,通過我們的軟件,客戶可以在相同的硬件資源上實(shí)現(xiàn)更快的推理速度和更高的并發(fā)性能,實(shí)現(xiàn)AI應(yīng)用落地更高效、更低成本,讓國產(chǎn)硬件也能“比肩”英偉達(dá)。
新京報(bào)AI研究院:清程極智的員工非常年輕,團(tuán)隊(duì)為何是這樣的組合?
師天麾:我們團(tuán)隊(duì)30歲以上的人很少,只有三名80后。年齡最大的為1985年出生,最小的則是一名已經(jīng)保送清華的高三實(shí)習(xí)生。相比學(xué)校更側(cè)重理論基礎(chǔ)學(xué)習(xí),企業(yè)可以真正讓理論學(xué)以致用。當(dāng)我們把一個(gè)實(shí)際問題足夠細(xì)化,最后就會(huì)變成一個(gè)題目,交給這名高三實(shí)習(xí)生后,他用一兩天時(shí)間就做完了一周的工作,并且反饋說終于明白了在學(xué)校學(xué)習(xí)的計(jì)算機(jī)理論基礎(chǔ)“有什么用”。
我們團(tuán)隊(duì)年輕的原因一方面是所在的行業(yè)比較熱門,團(tuán)隊(duì)技術(shù)背景也很好,對同學(xué)們挺有吸引力的,所以一些剛出校門的同學(xué)就加入清程了。另一方面,其實(shí)AI Infra研究相關(guān)職位并不好招人,相比算法,我們的工作更加偏向底層,圈子“就這么大”。所以,我們也愿意招一些有想法、有熱情、基礎(chǔ)扎實(shí)、學(xué)習(xí)能力強(qiáng)的年輕人進(jìn)行培養(yǎng),有些甚至是在校生。同時(shí),AI行業(yè)本身也比較年輕,有些擔(dān)起重任的技術(shù)大佬也是95后甚至00后,也就是互聯(lián)網(wǎng)原住民一代。
新京報(bào)AI研究院:從你進(jìn)入清華到現(xiàn)在,已經(jīng)過去了十年,這期間AI技術(shù)已經(jīng)經(jīng)歷了至少兩輪浪潮,對此有什么感受?怎么看待熱點(diǎn)變化對學(xué)生選擇專業(yè)的影響?
師天麾:當(dāng)我決定走高性能算力這條路時(shí),技術(shù)熱點(diǎn)的變化對我就影響不大了。因?yàn)椴徽撌荂V、大模型,還是再往前的云計(jì)算、超算,哪一項(xiàng)技術(shù)火爆,只要用的人多起來,成本在一定程度上就會(huì)變高,都需要通過高性能計(jì)算來加速、降本。
入校時(shí)火爆的熱點(diǎn),可能畢業(yè)時(shí)不一定再熱。但學(xué)生只要打牢基礎(chǔ),無論未來什么熱點(diǎn)火爆,高性能計(jì)算的能力都可以很好地運(yùn)用進(jìn)去。
商機(jī)· 從訓(xùn)練轉(zhuǎn)向推理,踩點(diǎn)DeepSeek爆火
新京報(bào)AI研究院:今年1月底開始,DeepSeek爆火,作為從事算力研究的AI Infra公司,你們受到了怎樣的影響?
師天麾:春節(jié)期間打開手機(jī),朋友圈到處都是DeepSeek的消息。很多去年和我們合作的國產(chǎn)公司開始密集和我們探討怎樣快速適配DeepSeek。春節(jié)期間,我們和這些公司幾乎每天都在溝通。
DeepSeek采用MoE(混合專家模型)架構(gòu),我們在前幾年MoE剛出現(xiàn)時(shí)就判斷它會(huì)成為未來的重要趨勢,因此進(jìn)行了MoE模型訓(xùn)練、推理加速的技術(shù)積累,也發(fā)表了一些國際頂級(jí)會(huì)議的論文。
清程極智的客戶生態(tài)主要包括硬件廠商、大模型研發(fā)企業(yè)以及有數(shù)字化轉(zhuǎn)型需求的企業(yè)。去年,大模型訓(xùn)練的需求高于推理的需求,但隨著DeepSeek出現(xiàn),企業(yè)對推理服務(wù)的需求正超越傳統(tǒng)的訓(xùn)練需求,而我們推出的DeepSeek一體機(jī)以低技術(shù)門檻,讓企業(yè)在無需專業(yè)AI團(tuán)隊(duì)支撐的環(huán)境下也能部署并使用大模型,作用類似于AI領(lǐng)域的“傻瓜相機(jī)”。
我們做推理的優(yōu)勢很大,因?yàn)镈eepSeek需要多機(jī)器推理,涉及上層并行計(jì)算的優(yōu)化,這方面我們有面向超大規(guī)模國產(chǎn)算力集群研制的大模型訓(xùn)練系統(tǒng)“八卦爐”,計(jì)算能力已擴(kuò)展到10萬臺(tái)服務(wù)器超大規(guī)模集群,所以在多機(jī)并行計(jì)算、通信優(yōu)化等方面經(jīng)驗(yàn)豐富,將這一數(shù)量級(jí)的集群優(yōu)化經(jīng)驗(yàn)放到幾臺(tái)機(jī)器上,做起來非常順手。
目前,我們的一體機(jī)產(chǎn)品部署較多的模型主要有DeepSeek、智譜GLM 、Qwen和llama等主流模型。
新京報(bào)AI研究院:發(fā)展大模型,算力是一個(gè)繞不開的話題。英偉達(dá)在這一領(lǐng)域經(jīng)營多年,甚至衡量一家企業(yè)的算力往往是看其擁有多少張“英偉達(dá)卡”。你的發(fā)展愿景會(huì)是成為下一個(gè)英偉達(dá)嗎?
師天麾:相比于成為英偉達(dá),我們的定位更類似于幫助國產(chǎn)芯片比肩英偉達(dá)。讓國產(chǎn)芯片以及老舊英偉達(dá)芯片的能力達(dá)到和英偉達(dá)新版芯片一樣。今年初,清程極智與清華共同開源了大模型推理引擎“赤兔”(chitu),通過赤兔的部署,讓英偉達(dá)老卡舊卡及國產(chǎn)芯片可以支持FP8精度模型,從而能夠運(yùn)行DeepSeek滿血版。下一步,我們也將嘗試讓CPU服務(wù)器也能高效運(yùn)行大模型。
當(dāng)前,國產(chǎn)硬件正在慢慢變成熟,但這需要一定的過程,比如我們在使用國產(chǎn)硬件時(shí)會(huì)發(fā)現(xiàn)一些底層Bug,此時(shí)我們會(huì)和對方進(jìn)行反饋。
其實(shí),英偉達(dá)從建立起CUDA生態(tài)到很多人用,時(shí)間上也沒有很久,其崛起的主要因素是趕上了GPU適配AI訓(xùn)練推理的技術(shù)紅利期。所以歸根結(jié)底,這還是國產(chǎn)生態(tài)的問題——不一定需要一味在硬件上追逐趕超,通過軟硬協(xié)同一樣能讓國產(chǎn)顯卡更好用,以我國在工業(yè)制造領(lǐng)域強(qiáng)大的產(chǎn)業(yè)化能力,參照手機(jī)、汽車等行業(yè)的演進(jìn)軌跡,完全具備在合理周期內(nèi)實(shí)現(xiàn)顯卡產(chǎn)品的性價(jià)比突破。
當(dāng)前,很多央國企已批量采購國產(chǎn)顯卡設(shè)備,但實(shí)際部署時(shí)仍依賴海外推理引擎,而部分前瞻性客戶已啟動(dòng)專項(xiàng)采購流程,將國產(chǎn)推理引擎納入采購流程,這標(biāo)志著市場對純國產(chǎn)技術(shù)棧的認(rèn)可度正在提升。
當(dāng)前,DeepSeek的出現(xiàn)證明國產(chǎn)大模型已經(jīng)不輸世界一流模型了,如果不用上同樣好的國產(chǎn)顯卡和推理引擎,生態(tài)就不完整,只有生態(tài)好,算力國產(chǎn)化的目標(biāo)才能更好實(shí)現(xiàn)。
我們的最終目標(biāo)是:不管底層的硬件是什么,只要通過我們的軟件引擎,都能夠感受到相同性能的算力服務(wù),規(guī)避掉硬件的差異。
抉擇·KPI壓力帶不來創(chuàng)新
新京報(bào)AI研究院:DeepSeek的團(tuán)隊(duì)也很年輕,你怎么看待DeepSeek在創(chuàng)新方面的成功?
師天麾:DeepSeek做得很好,原因之一當(dāng)然是他們招攬的人才非常厲害。我們組博二和博三的同學(xué)全部收到過DeepSeek的郵件。相比大廠,DeepSeek少了一些KPI的壓力,更類似于學(xué)校里博士從事的科研工作,即“找一個(gè)有意思的點(diǎn),盡量去實(shí)現(xiàn)。做一件有意義的事情,但不要求給我?guī)矶嗌偈找妗薄?/p>
一旦有了KPI的壓力,往往就不敢去做收益不確定的事情,會(huì)更加傾向于復(fù)制已有的、明確的路徑,這不會(huì)冒險(xiǎn),但也做不出“特別不一樣”的東西。
新京報(bào)AI研究院:以你自身的經(jīng)歷來看,AI相關(guān)專業(yè)畢業(yè)生在初創(chuàng)企業(yè)、大廠與學(xué)校科研之間如何抉擇?在企業(yè)的經(jīng)歷和實(shí)驗(yàn)室有何不同?
師天麾:我博士畢業(yè)后,就已經(jīng)有大廠發(fā)來了薪資很高的offer,但我當(dāng)時(shí)更傾向于創(chuàng)業(yè),做一些不同的事。在大廠,大多情況下是“老板安排什么就做什么”,同時(shí)要背負(fù)一定KPI,如果被這些東西束縛住,可能一些事情將難以開展。當(dāng)初如果我選擇了大廠,可能也會(huì)先待兩三年熟悉產(chǎn)業(yè)界,有了經(jīng)驗(yàn)再出來創(chuàng)業(yè)。對于大廠來說,“你就值這個(gè)錢,你必須做這件事才能發(fā)揮價(jià)值?!?/p>
在清程極智,我們基本很少加班,氛圍開放并不“內(nèi)卷”。我們對自己的技術(shù)非常有信心,我們相信,頂級(jí)的技術(shù)人員不是逼著加班就能釋放出生產(chǎn)力的,最重要的是不受限制的創(chuàng)造力。
對于學(xué)界與企業(yè)的區(qū)別,學(xué)校的實(shí)驗(yàn)室會(huì)更多地從技術(shù)角度分析一件事,比如大模型訓(xùn)練推理系統(tǒng)的性能瓶頸在哪里,如何解決使其加速。在學(xué)校,1萬行代碼就能驗(yàn)證一個(gè)想法,但要把這個(gè)想法變成可用、穩(wěn)定、幾乎沒有Bug的產(chǎn)品,可能需要幾十萬代碼。這就是企業(yè)要做的,對于企業(yè)的產(chǎn)品,性能好并不代表絕對好用,需要更多權(quán)衡,更多產(chǎn)品工程化。
同時(shí),實(shí)驗(yàn)室對于投產(chǎn)比沒有那么在意。企業(yè)則需要向投資人交代,試錯(cuò)成本不能太大。最后,二者的節(jié)奏也有所不同,企業(yè)需要看市場上客戶真正需要什么,要從用戶角度來考慮市場的變化,并進(jìn)行積極地適配。
記者聯(lián)系郵箱:luoyidan@xjbnews.com
新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹
編輯 王進(jìn)雨
校對 楊許麗