伴隨著人工智能的快速發(fā)展,各種大模型技術(shù)也持續(xù)飛躍,尤其是自國(guó)產(chǎn)大模型DeepSeek的推出,低成本、高效能的AI產(chǎn)品以席卷之勢(shì)融入我們生活和工作的方方面面。然而,在這個(gè)過(guò)程中,就業(yè)替代、信息虛假傳播等倫理與社會(huì)問(wèn)題也逐漸浮現(xiàn)并引發(fā)關(guān)注和思考。


如何看待大模型目前發(fā)展的階段?各行各業(yè)紛紛與DeepSeek等大模型深度融合,這是機(jī)遇還是挑戰(zhàn)?大模型發(fā)展背后,如何平衡其成本、效率和創(chuàng)新的問(wèn)題?新京報(bào)圍繞相關(guān)話題采訪了經(jīng)濟(jì)學(xué)家、橫琴數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會(huì)主席朱嘉明。


經(jīng)濟(jì)學(xué)家、橫琴數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會(huì)主席朱嘉明。


新京報(bào)貝殼財(cái)經(jīng)自DeepSeek火爆之后,各種大模型蜂擁而來(lái),怎么看待當(dāng)前大模型推出的速度和質(zhì)量?


朱嘉明:整體來(lái)看,大模型正在呈現(xiàn)數(shù)量和質(zhì)量?jī)蓚€(gè)方面的演進(jìn)。第一,在大模型的數(shù)量方面,加速增長(zhǎng),根據(jù)人工智能研究機(jī)構(gòu)Epoch AI的統(tǒng)計(jì)數(shù)據(jù),在ChatGPT推出的2022年,訓(xùn)練算力超過(guò)1023次浮點(diǎn)運(yùn)算的模型有22個(gè),在2024年,這樣的模型已經(jīng)有99個(gè)。第二,在大模型的質(zhì)量方面,從2025年開(kāi)始,大模型研發(fā)已經(jīng)完成了從粗放到集約的歷史轉(zhuǎn)型,即從主要通過(guò)不斷增大參數(shù)量和數(shù)據(jù)規(guī)模來(lái)提升模型性能,轉(zhuǎn)變?yōu)閺?qiáng)調(diào)算法架構(gòu)創(chuàng)新、數(shù)據(jù)預(yù)處理與微調(diào)策略,以及硬件與能效的協(xié)同提升,乃至關(guān)注大模型的實(shí)際落地收益與相應(yīng)的組織結(jié)構(gòu)調(diào)整。


需要澄清的是,大模型領(lǐng)域雖然不存在權(quán)力的直接干擾,但并非無(wú)政府主義狀態(tài),而是有嚴(yán)格且多元的標(biāo)準(zhǔn)體系與規(guī)范網(wǎng)絡(luò)共同構(gòu)建的有序生態(tài)。只有滿足這些技術(shù)、倫理、平臺(tái)和法律的要求,大模型才能獲得廣泛認(rèn)可與應(yīng)用。全世界全面滿足技術(shù)標(biāo)準(zhǔn)、社區(qū)準(zhǔn)則和法律法規(guī)要求的大模型極為有限。大多數(shù)的人工智能生成式模型,其實(shí)是在開(kāi)源大模型基礎(chǔ)上,針對(duì)應(yīng)用目標(biāo)的垂直領(lǐng)域進(jìn)行參數(shù)優(yōu)化的產(chǎn)物。


2025年的大模型研發(fā)還有一個(gè)更為重要的特征:大模型正在展現(xiàn)前所未有的多模態(tài)的推理能力。大模型從語(yǔ)言中心向“內(nèi)在多模態(tài)”架構(gòu)轉(zhuǎn)變,強(qiáng)調(diào)跨模態(tài)主動(dòng)推理和交互式反饋,以提升模型在復(fù)雜場(chǎng)景下的適應(yīng)能力。新一代模型能夠同時(shí)處理文本、圖像、音頻、視頻等多種格式,將各模態(tài)輸入映射到統(tǒng)一的嵌入空間,實(shí)現(xiàn)跨模態(tài)理解與推理。例如,OpenAI的o3模型支持對(duì)場(chǎng)景圖像進(jìn)行空間變換(如縮放、旋轉(zhuǎn))、圖文問(wèn)答及工具調(diào)用,顯著增強(qiáng)了視覺(jué)+文本推理的深度和廣度。


大模型的發(fā)展方向變得越來(lái)越明朗。未來(lái)兩到三年里,隨著腦科學(xué)不斷揭示大腦運(yùn)作的奧秘,量子技術(shù)也在加速成熟,兩者都有望與現(xiàn)有的AI大模型產(chǎn)生深度融合和交叉創(chuàng)新。這種新一輪的“碰撞”不僅會(huì)提高模型的計(jì)算效率和推理能力,還可能催生出更接近人類思維模式的智能體系,標(biāo)志著“大模型2.0時(shí)代”的來(lái)臨。與此同時(shí),以大模型為核心的AI技術(shù)正在迅速走向市場(chǎng)。研發(fā)與部署成本持續(xù)降低,使得企業(yè)和個(gè)人都能更輕松地使用這些先進(jìn)系統(tǒng)。無(wú)論是在智能家居、醫(yī)療診斷還是教育輔助中,這些模型正以前所未有的速度融入日常生活,悄然改變?nèi)藗兊墓ぷ髋c娛樂(lè)方式。


新京報(bào)貝殼財(cái)經(jīng)如何理解該標(biāo)準(zhǔn)?


朱嘉明:大模型研發(fā)是存在標(biāo)準(zhǔn)的。大模型的發(fā)展離不開(kāi)一套由業(yè)界、學(xué)術(shù)界和標(biāo)準(zhǔn)組織共同制定并不斷更新的評(píng)估與認(rèn)證標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)在形成過(guò)程中依賴多方參與與共識(shí),并隨著模型能力的提升不斷推進(jìn),體現(xiàn)了“標(biāo)準(zhǔn)-挑戰(zhàn)-突破-再標(biāo)準(zhǔn)”的動(dòng)態(tài)循環(huán)。首先,領(lǐng)先團(tuán)隊(duì)或企業(yè)發(fā)布具有顯著創(chuàng)新的大模型,確立行業(yè)新基準(zhǔn);之后,其他團(tuán)隊(duì)圍繞該基準(zhǔn)發(fā)起攻關(guān),改進(jìn)模型架構(gòu)、訓(xùn)練方法或多模態(tài)融合技術(shù);然后,關(guān)鍵技術(shù)或應(yīng)用場(chǎng)景取得新的性能躍遷,推動(dòng)模型達(dá)到更高水平;最后,突破成果成為新的行業(yè)標(biāo)桿,開(kāi)啟下一輪競(jìng)爭(zhēng)與共創(chuàng)循環(huán)。


這一循環(huán)模式使得大模型生態(tài)不但在性能上不斷升級(jí),也在標(biāo)準(zhǔn)體系、數(shù)據(jù)集構(gòu)建與測(cè)試方法等方面同步演進(jìn),形成良性、共贏的技術(shù)創(chuàng)新環(huán)境。


新京報(bào)貝殼財(cái)經(jīng)目前國(guó)內(nèi)的大模型處于什么階段?


朱嘉明:國(guó)內(nèi)大模型已進(jìn)入普及化和大眾化階段,使用人數(shù)持續(xù)快速增長(zhǎng),應(yīng)用正從通用場(chǎng)景向金融、工業(yè)、政務(wù)、司法、民生等行業(yè)縱深滲透。但嚴(yán)格來(lái)說(shuō),這只是起步,真正的產(chǎn)業(yè)深度結(jié)合仍需更多落地探索,預(yù)計(jì)在下半年以后隨著政策供給和資金投入的進(jìn)一步加碼,產(chǎn)業(yè)化部署和規(guī)?;瘧?yīng)用將顯著提速。


國(guó)內(nèi)大模型呈現(xiàn)互補(bǔ)功能格局,沒(méi)有單一模型能在所有指標(biāo)上全能表現(xiàn)。不同類型的人工智能模型協(xié)同并進(jìn)的體系正在形成,以滿足不同場(chǎng)景的多元需求。


在物理形態(tài)領(lǐng)域,中國(guó)已實(shí)現(xiàn)關(guān)鍵技術(shù)突破并大規(guī)模部署工業(yè)機(jī)器人。2023年中國(guó)安裝了逾27萬(wàn)臺(tái)工業(yè)機(jī)器人,是日本的6倍、美國(guó)的7倍,占全球安裝量的51%。


新京報(bào)貝殼財(cái)經(jīng)大模型1.0和2.0的根本區(qū)別是什么?


朱嘉明:大模型的1.0時(shí)代主要基于深度學(xué)習(xí)中的Transformer架構(gòu),不斷在規(guī)模和微調(diào)技術(shù)上迭代;而2.0時(shí)代則有望突破Transformer本身的限制,通過(guò)引入類腦計(jì)算和量子計(jì)算等全新范式實(shí)現(xiàn)性能和效率的跨越。


自從OpenAI的GPT系列模型問(wèn)世,以Transformer為核心的大模型進(jìn)入1.0時(shí)代。該階段主要依靠不斷擴(kuò)大參數(shù)規(guī)模、豐富訓(xùn)練數(shù)據(jù),以及引入人類反饋強(qiáng)化學(xué)習(xí)、稀疏注意力和混合專家等技術(shù)提升生成質(zhì)量與效率。DeepSeek憑借多步預(yù)測(cè)和計(jì)算稀疏化手段,將推理性能追平Llama 3.1,而最新“o3”版本通過(guò)激進(jìn)剪枝與并行化策略,進(jìn)一步降低了延遲與成本。


然而,隨著算力投入回報(bào)遞減,大模型研發(fā)人員已將目光投向2.0時(shí)代。下一代模型將突破Transformer固有的二次方復(fù)雜度限制,采用線性化或稀疏化注意力,實(shí)現(xiàn)更長(zhǎng)上下文的高效管理;并有望在類腦神經(jīng)形態(tài)芯片上通過(guò)異步、事件驅(qū)動(dòng)的架構(gòu)顯著提升能效。同時(shí),量子-經(jīng)典混合計(jì)算模式正逐步成熟,通過(guò)可參數(shù)化量子電路完成部分推理,在文本分類和語(yǔ)言建模任務(wù)中展現(xiàn)出與傳統(tǒng)模型相當(dāng)卻更低能耗的潛力。


新京報(bào)貝殼財(cái)經(jīng)DeepSeek在成本控制上展現(xiàn)出巨大優(yōu)勢(shì),怎么看待大模型推出背后成本和效率、創(chuàng)新的關(guān)系?


朱嘉明:DeepSeek在控制AI模型成本方面展現(xiàn)出顯著優(yōu)勢(shì),但對(duì)其創(chuàng)新成本的簡(jiǎn)單比較忽略了代際演進(jìn)和不同發(fā)展階段的成本結(jié)構(gòu)差異。第一代創(chuàng)新往往伴隨著高昂的資源投入,而后續(xù)迭代則能借助先行經(jīng)驗(yàn)和技術(shù)優(yōu)化實(shí)現(xiàn)“后進(jìn)優(yōu)勢(shì)”。在“0到1”階段,大量基礎(chǔ)設(shè)施建設(shè)和未知風(fēng)險(xiǎn)必然推高成本;進(jìn)入“1到10”階段后,通過(guò)流程標(biāo)準(zhǔn)化和效率優(yōu)化則有可能降低單位成本。盡管成本是衡量AI競(jìng)爭(zhēng)力的重要指標(biāo)之一,但并非唯一標(biāo)準(zhǔn)。為了持續(xù)保持領(lǐng)先,DeepSeek在下一步模型研發(fā)中仍需投入更高性能的芯片和基礎(chǔ)設(shè)施,這意味著其成本將呈上升趨勢(shì)。綜合來(lái)看,DeepSeek的成本控制策略在當(dāng)下確立了競(jìng)爭(zhēng)優(yōu)勢(shì),但其長(zhǎng)期成本曲線依然受創(chuàng)新代際、更高性能需求以及基礎(chǔ)設(shè)施投入的推動(dòng)而上揚(yáng)。成本雖是重要指標(biāo),但需與性能、可持續(xù)性和技術(shù)迭代等多重因素并重評(píng)估。


新京報(bào)貝殼財(cái)經(jīng)AI 和大模型的發(fā)展如何重塑全球產(chǎn)業(yè)結(jié)構(gòu)和經(jīng)濟(jì)格局?


朱嘉明: AI作為一種全新工具,不僅催生出全新的產(chǎn)業(yè)形態(tài),還將傳統(tǒng)行業(yè)置于必須適應(yīng)其運(yùn)作邏輯和基礎(chǔ)設(shè)施的境地,從而實(shí)現(xiàn)對(duì)傳統(tǒng)行業(yè)的重塑,而不是簡(jiǎn)單地在既有框架下進(jìn)行升級(jí)或改造。


需要注意到,智能體經(jīng)濟(jì)與人機(jī)協(xié)同網(wǎng)絡(luò)正在興起。第一,AI 智能體正在脫離“應(yīng)答者”身份,成為可以主動(dòng)調(diào)度、決策與協(xié)作的經(jīng)濟(jì)參與者,構(gòu)建出以“智能體總線”為入口的分布式運(yùn)行環(huán)境。第二,垂直領(lǐng)域智能體憑借對(duì)行業(yè)語(yǔ)言和需求的深度理解,率先掌握了資源配置與入口控制權(quán)。第三,不同智能體之間的價(jià)值交換與協(xié)作,正在孕育一種全新的“組織結(jié)構(gòu)”,即人-機(jī)智能體共生的經(jīng)濟(jì)網(wǎng)絡(luò)。


新京報(bào)貝殼財(cái)經(jīng)AI 和大模型廣泛應(yīng)用的同時(shí),也帶來(lái)了算法偏見(jiàn)、就業(yè)替代、信息虛假傳播等倫理與社會(huì)問(wèn)題,怎么看待這些問(wèn)題的出現(xiàn)?


朱嘉明:AI在實(shí)現(xiàn)大規(guī)模數(shù)據(jù)處理和決策優(yōu)化方面展現(xiàn)出顯著優(yōu)勢(shì),但也伴隨算法偏見(jiàn)和虛假信息傳播等風(fēng)險(xiǎn)。這些問(wèn)題雖真實(shí)存在,卻并非AI應(yīng)用的主流,而通過(guò)技術(shù)改進(jìn)與制度治理可望在可預(yù)見(jiàn)的時(shí)間內(nèi)得到有效緩解。各國(guó)正加速推進(jìn)法規(guī)框架,以規(guī)范AI基礎(chǔ)設(shè)施建設(shè)與運(yùn)行;與此同時(shí),隨著業(yè)界經(jīng)驗(yàn)積累和公眾認(rèn)知提升,對(duì)AI的誤解與夸大也將逐步消退。


AI本質(zhì)上是一套處理海量、多源、高速數(shù)據(jù)的方法論,能夠彌補(bǔ)傳統(tǒng)手段在規(guī)模與復(fù)雜度上的不足。但是,公眾與決策者對(duì)AI的理解尚不均衡,部分“想象中的”風(fēng)險(xiǎn)被過(guò)度放大。


總體來(lái)看,AI正處于技術(shù)落地與社會(huì)認(rèn)知的“雙重夾擊”中,隨著標(biāo)準(zhǔn)化制度的建立與技術(shù)自身演進(jìn),算法偏見(jiàn)和虛假信息等問(wèn)題將逐步得到控制,AI處理大數(shù)據(jù)的核心優(yōu)勢(shì)將更為凸顯。


新京報(bào)貝殼財(cái)經(jīng)記者 胡萌 編輯 陳莉 校對(duì) 盧茜