伴隨著人工智能的快速發(fā)展,各種大模型技術(shù)也持續(xù)飛躍,尤其是自國產(chǎn)大模型DeepSeek的推出,低成本、高效能的AI產(chǎn)品以席卷之勢融入我們生活和工作的方方面面。然而,在這個過程中,就業(yè)替代、信息虛假傳播等倫理與社會問題也逐漸浮現(xiàn)并引發(fā)關(guān)注和思考。
如何看待大模型目前發(fā)展的階段?各行各業(yè)紛紛與DeepSeek等大模型深度融合,這是機(jī)遇還是挑戰(zhàn)?大模型發(fā)展背后,如何平衡其成本、效率和創(chuàng)新的問題?新京報圍繞相關(guān)話題采訪了經(jīng)濟(jì)學(xué)家、橫琴數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會主席朱嘉明。
經(jīng)濟(jì)學(xué)家、橫琴數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會主席朱嘉明。
新京報貝殼財經(jīng):自DeepSeek火爆之后,各種大模型蜂擁而來,怎么看待當(dāng)前大模型推出的速度和質(zhì)量?
朱嘉明:整體來看,大模型正在呈現(xiàn)數(shù)量和質(zhì)量兩個方面的演進(jìn)。第一,在大模型的數(shù)量方面,加速增長,根據(jù)人工智能研究機(jī)構(gòu)Epoch AI的統(tǒng)計(jì)數(shù)據(jù),在ChatGPT推出的2022年,訓(xùn)練算力超過1023次浮點(diǎn)運(yùn)算的模型有22個,在2024年,這樣的模型已經(jīng)有99個。第二,在大模型的質(zhì)量方面,從2025年開始,大模型研發(fā)已經(jīng)完成了從粗放到集約的歷史轉(zhuǎn)型,即從主要通過不斷增大參數(shù)量和數(shù)據(jù)規(guī)模來提升模型性能,轉(zhuǎn)變?yōu)閺?qiáng)調(diào)算法架構(gòu)創(chuàng)新、數(shù)據(jù)預(yù)處理與微調(diào)策略,以及硬件與能效的協(xié)同提升,乃至關(guān)注大模型的實(shí)際落地收益與相應(yīng)的組織結(jié)構(gòu)調(diào)整。
需要澄清的是,大模型領(lǐng)域雖然不存在權(quán)力的直接干擾,但并非無政府主義狀態(tài),而是有嚴(yán)格且多元的標(biāo)準(zhǔn)體系與規(guī)范網(wǎng)絡(luò)共同構(gòu)建的有序生態(tài)。只有滿足這些技術(shù)、倫理、平臺和法律的要求,大模型才能獲得廣泛認(rèn)可與應(yīng)用。全世界全面滿足技術(shù)標(biāo)準(zhǔn)、社區(qū)準(zhǔn)則和法律法規(guī)要求的大模型極為有限。大多數(shù)的人工智能生成式模型,其實(shí)是在開源大模型基礎(chǔ)上,針對應(yīng)用目標(biāo)的垂直領(lǐng)域進(jìn)行參數(shù)優(yōu)化的產(chǎn)物。
2025年的大模型研發(fā)還有一個更為重要的特征:大模型正在展現(xiàn)前所未有的多模態(tài)的推理能力。大模型從語言中心向“內(nèi)在多模態(tài)”架構(gòu)轉(zhuǎn)變,強(qiáng)調(diào)跨模態(tài)主動推理和交互式反饋,以提升模型在復(fù)雜場景下的適應(yīng)能力。新一代模型能夠同時處理文本、圖像、音頻、視頻等多種格式,將各模態(tài)輸入映射到統(tǒng)一的嵌入空間,實(shí)現(xiàn)跨模態(tài)理解與推理。例如,OpenAI的o3模型支持對場景圖像進(jìn)行空間變換(如縮放、旋轉(zhuǎn))、圖文問答及工具調(diào)用,顯著增強(qiáng)了視覺+文本推理的深度和廣度。
大模型的發(fā)展方向變得越來越明朗。未來兩到三年里,隨著腦科學(xué)不斷揭示大腦運(yùn)作的奧秘,量子技術(shù)也在加速成熟,兩者都有望與現(xiàn)有的AI大模型產(chǎn)生深度融合和交叉創(chuàng)新。這種新一輪的“碰撞”不僅會提高模型的計(jì)算效率和推理能力,還可能催生出更接近人類思維模式的智能體系,標(biāo)志著“大模型2.0時代”的來臨。與此同時,以大模型為核心的AI技術(shù)正在迅速走向市場。研發(fā)與部署成本持續(xù)降低,使得企業(yè)和個人都能更輕松地使用這些先進(jìn)系統(tǒng)。無論是在智能家居、醫(yī)療診斷還是教育輔助中,這些模型正以前所未有的速度融入日常生活,悄然改變?nèi)藗兊墓ぷ髋c娛樂方式。
新京報貝殼財經(jīng):如何理解該標(biāo)準(zhǔn)?
朱嘉明:大模型研發(fā)是存在標(biāo)準(zhǔn)的。大模型的發(fā)展離不開一套由業(yè)界、學(xué)術(shù)界和標(biāo)準(zhǔn)組織共同制定并不斷更新的評估與認(rèn)證標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)在形成過程中依賴多方參與與共識,并隨著模型能力的提升不斷推進(jìn),體現(xiàn)了“標(biāo)準(zhǔn)-挑戰(zhàn)-突破-再標(biāo)準(zhǔn)”的動態(tài)循環(huán)。首先,領(lǐng)先團(tuán)隊(duì)或企業(yè)發(fā)布具有顯著創(chuàng)新的大模型,確立行業(yè)新基準(zhǔn);之后,其他團(tuán)隊(duì)圍繞該基準(zhǔn)發(fā)起攻關(guān),改進(jìn)模型架構(gòu)、訓(xùn)練方法或多模態(tài)融合技術(shù);然后,關(guān)鍵技術(shù)或應(yīng)用場景取得新的性能躍遷,推動模型達(dá)到更高水平;最后,突破成果成為新的行業(yè)標(biāo)桿,開啟下一輪競爭與共創(chuàng)循環(huán)。
這一循環(huán)模式使得大模型生態(tài)不但在性能上不斷升級,也在標(biāo)準(zhǔn)體系、數(shù)據(jù)集構(gòu)建與測試方法等方面同步演進(jìn),形成良性、共贏的技術(shù)創(chuàng)新環(huán)境。
新京報貝殼財經(jīng):目前國內(nèi)的大模型處于什么階段?
朱嘉明:國內(nèi)大模型已進(jìn)入普及化和大眾化階段,使用人數(shù)持續(xù)快速增長,應(yīng)用正從通用場景向金融、工業(yè)、政務(wù)、司法、民生等行業(yè)縱深滲透。但嚴(yán)格來說,這只是起步,真正的產(chǎn)業(yè)深度結(jié)合仍需更多落地探索,預(yù)計(jì)在下半年以后隨著政策供給和資金投入的進(jìn)一步加碼,產(chǎn)業(yè)化部署和規(guī)?;瘧?yīng)用將顯著提速。
國內(nèi)大模型呈現(xiàn)互補(bǔ)功能格局,沒有單一模型能在所有指標(biāo)上全能表現(xiàn)。不同類型的人工智能模型協(xié)同并進(jìn)的體系正在形成,以滿足不同場景的多元需求。
在物理形態(tài)領(lǐng)域,中國已實(shí)現(xiàn)關(guān)鍵技術(shù)突破并大規(guī)模部署工業(yè)機(jī)器人。2023年中國安裝了逾27萬臺工業(yè)機(jī)器人,是日本的6倍、美國的7倍,占全球安裝量的51%。
新京報貝殼財經(jīng):大模型1.0和2.0的根本區(qū)別是什么?
朱嘉明:大模型的1.0時代主要基于深度學(xué)習(xí)中的Transformer架構(gòu),不斷在規(guī)模和微調(diào)技術(shù)上迭代;而2.0時代則有望突破Transformer本身的限制,通過引入類腦計(jì)算和量子計(jì)算等全新范式實(shí)現(xiàn)性能和效率的跨越。
自從OpenAI的GPT系列模型問世,以Transformer為核心的大模型進(jìn)入1.0時代。該階段主要依靠不斷擴(kuò)大參數(shù)規(guī)模、豐富訓(xùn)練數(shù)據(jù),以及引入人類反饋強(qiáng)化學(xué)習(xí)、稀疏注意力和混合專家等技術(shù)提升生成質(zhì)量與效率。DeepSeek憑借多步預(yù)測和計(jì)算稀疏化手段,將推理性能追平Llama 3.1,而最新“o3”版本通過激進(jìn)剪枝與并行化策略,進(jìn)一步降低了延遲與成本。
然而,隨著算力投入回報遞減,大模型研發(fā)人員已將目光投向2.0時代。下一代模型將突破Transformer固有的二次方復(fù)雜度限制,采用線性化或稀疏化注意力,實(shí)現(xiàn)更長上下文的高效管理;并有望在類腦神經(jīng)形態(tài)芯片上通過異步、事件驅(qū)動的架構(gòu)顯著提升能效。同時,量子-經(jīng)典混合計(jì)算模式正逐步成熟,通過可參數(shù)化量子電路完成部分推理,在文本分類和語言建模任務(wù)中展現(xiàn)出與傳統(tǒng)模型相當(dāng)卻更低能耗的潛力。
新京報貝殼財經(jīng):DeepSeek在成本控制上展現(xiàn)出巨大優(yōu)勢,怎么看待大模型推出背后成本和效率、創(chuàng)新的關(guān)系?
朱嘉明:DeepSeek在控制AI模型成本方面展現(xiàn)出顯著優(yōu)勢,但對其創(chuàng)新成本的簡單比較忽略了代際演進(jìn)和不同發(fā)展階段的成本結(jié)構(gòu)差異。第一代創(chuàng)新往往伴隨著高昂的資源投入,而后續(xù)迭代則能借助先行經(jīng)驗(yàn)和技術(shù)優(yōu)化實(shí)現(xiàn)“后進(jìn)優(yōu)勢”。在“0到1”階段,大量基礎(chǔ)設(shè)施建設(shè)和未知風(fēng)險必然推高成本;進(jìn)入“1到10”階段后,通過流程標(biāo)準(zhǔn)化和效率優(yōu)化則有可能降低單位成本。盡管成本是衡量AI競爭力的重要指標(biāo)之一,但并非唯一標(biāo)準(zhǔn)。為了持續(xù)保持領(lǐng)先,DeepSeek在下一步模型研發(fā)中仍需投入更高性能的芯片和基礎(chǔ)設(shè)施,這意味著其成本將呈上升趨勢。綜合來看,DeepSeek的成本控制策略在當(dāng)下確立了競爭優(yōu)勢,但其長期成本曲線依然受創(chuàng)新代際、更高性能需求以及基礎(chǔ)設(shè)施投入的推動而上揚(yáng)。成本雖是重要指標(biāo),但需與性能、可持續(xù)性和技術(shù)迭代等多重因素并重評估。
新京報貝殼財經(jīng):AI 和大模型的發(fā)展如何重塑全球產(chǎn)業(yè)結(jié)構(gòu)和經(jīng)濟(jì)格局?
朱嘉明: AI作為一種全新工具,不僅催生出全新的產(chǎn)業(yè)形態(tài),還將傳統(tǒng)行業(yè)置于必須適應(yīng)其運(yùn)作邏輯和基礎(chǔ)設(shè)施的境地,從而實(shí)現(xiàn)對傳統(tǒng)行業(yè)的重塑,而不是簡單地在既有框架下進(jìn)行升級或改造。
需要注意到,智能體經(jīng)濟(jì)與人機(jī)協(xié)同網(wǎng)絡(luò)正在興起。第一,AI 智能體正在脫離“應(yīng)答者”身份,成為可以主動調(diào)度、決策與協(xié)作的經(jīng)濟(jì)參與者,構(gòu)建出以“智能體總線”為入口的分布式運(yùn)行環(huán)境。第二,垂直領(lǐng)域智能體憑借對行業(yè)語言和需求的深度理解,率先掌握了資源配置與入口控制權(quán)。第三,不同智能體之間的價值交換與協(xié)作,正在孕育一種全新的“組織結(jié)構(gòu)”,即人-機(jī)智能體共生的經(jīng)濟(jì)網(wǎng)絡(luò)。
新京報貝殼財經(jīng):AI 和大模型廣泛應(yīng)用的同時,也帶來了算法偏見、就業(yè)替代、信息虛假傳播等倫理與社會問題,怎么看待這些問題的出現(xiàn)?
朱嘉明:AI在實(shí)現(xiàn)大規(guī)模數(shù)據(jù)處理和決策優(yōu)化方面展現(xiàn)出顯著優(yōu)勢,但也伴隨算法偏見和虛假信息傳播等風(fēng)險。這些問題雖真實(shí)存在,卻并非AI應(yīng)用的主流,而通過技術(shù)改進(jìn)與制度治理可望在可預(yù)見的時間內(nèi)得到有效緩解。各國正加速推進(jìn)法規(guī)框架,以規(guī)范AI基礎(chǔ)設(shè)施建設(shè)與運(yùn)行;與此同時,隨著業(yè)界經(jīng)驗(yàn)積累和公眾認(rèn)知提升,對AI的誤解與夸大也將逐步消退。
AI本質(zhì)上是一套處理海量、多源、高速數(shù)據(jù)的方法論,能夠彌補(bǔ)傳統(tǒng)手段在規(guī)模與復(fù)雜度上的不足。但是,公眾與決策者對AI的理解尚不均衡,部分“想象中的”風(fēng)險被過度放大。
總體來看,AI正處于技術(shù)落地與社會認(rèn)知的“雙重夾擊”中,隨著標(biāo)準(zhǔn)化制度的建立與技術(shù)自身演進(jìn),算法偏見和虛假信息等問題將逐步得到控制,AI處理大數(shù)據(jù)的核心優(yōu)勢將更為凸顯。
新京報貝殼財經(jīng)記者 胡萌 編輯 陳莉 校對 盧茜