国产欧美日韩在线观看_天堂8在线官网_国产丝袜精品丝袜久久_最近中文免费国语在线观看_在线观看黄网站

對(duì)話智源研究院院長王仲遠(yuǎn):AI正加速從數(shù)字世界走向物理世界

2025-06-09 09:12

2025年智源大會(huì)上,人形機(jī)器人不再是吉祥物,被“圍堵”的人從楊植麟變成了王興興。

這一年,AI進(jìn)展迅猛,迭代周期甚至少于3個(gè)月,且不再局限于大語言模型,而是轉(zhuǎn)化為人形機(jī)器人訓(xùn)練、落地的強(qiáng)輔助。

“人工智能正在加速從數(shù)字世界走向物理世界?!敝窃囱芯吭涸洪L王仲遠(yuǎn)在接受包括21世紀(jì)經(jīng)濟(jì)報(bào)道在內(nèi)的記者采訪時(shí)直言:“人工智能應(yīng)該為世界做一些實(shí)實(shí)在在的事情,幫助人類擺脫繁瑣的、重復(fù)的以及簡單的勞動(dòng)?!?/p>

AI技術(shù)路線轉(zhuǎn)向世界模型

“大模型技術(shù)還遠(yuǎn)沒有到發(fā)展的盡頭,過往所說的‘百模大戰(zhàn)’更多是大語言模型的競(jìng)爭,而大語言模型受限于互聯(lián)網(wǎng)數(shù)據(jù)的使用,基礎(chǔ)模型性能雖然還在提升,但是提升速度不如以前。”在王仲遠(yuǎn)看來,大語言模型性能提升瓶頸的解法主要包括三個(gè)方面,一是強(qiáng)化學(xué)習(xí)優(yōu)化推理能力,二是合成高質(zhì)量數(shù)據(jù)替代人類標(biāo)注,三是激活海量未充分利用的多模態(tài)數(shù)據(jù),多模態(tài)數(shù)據(jù)的規(guī)??蛇_(dá)文本的“百倍乃至萬倍”。

在智源研究院的判斷中,大模型的技術(shù)路線會(huì)從大語言模型往多模態(tài)尤其是原生多模態(tài)世界模型的方向發(fā)展。原生多模態(tài)世界模型本質(zhì)上是為了讓人工智能感知和理解物理世界,進(jìn)而推進(jìn)和物理世界的交互。進(jìn)入物理世界之后,在宏觀層面,大模型與硬件結(jié)合,通過具身智能的發(fā)展解決實(shí)際生產(chǎn)生活問題。

“所有這一切構(gòu)成的世界模型,是實(shí)現(xiàn)物理AGI的重要發(fā)展路徑?!蓖踔龠h(yuǎn)表示,智源研究院的工作布局都是圍繞這一技術(shù)發(fā)展趨勢(shì)進(jìn)行的。

在2025北京智源大會(huì)上,繼“悟道”系列大模型之后,智源研究院推出了“悟界”系列大模型,包括原生多模態(tài)世界模型Emu3、腦科學(xué)多模態(tài)通用基礎(chǔ)模型見微Brainμ、跨本體具身大小腦協(xié)作框架RoboOS 2.0與具身大腦RoboBrain 2.0以及全原子微觀生命模型OpenComplex2。

到底該如何定義“世界模型”內(nèi)核,王仲遠(yuǎn)以咖啡杯舉例:“現(xiàn)有模型能描述‘白色帶文字的杯子在桌上’,但無法判斷‘杯沿懸空可能墜落’——這需要時(shí)空預(yù)測(cè)能力?!彼麖?qiáng)調(diào)Emu3的核心突破正在于此:建立對(duì)物理因果關(guān)系的理解,而不僅是多模態(tài)信息拼接。

爭議中的具身智能落地路徑

當(dāng)被問及具身智能的技術(shù)路線之爭,王仲遠(yuǎn)展現(xiàn)出務(wù)實(shí)的態(tài)度。

??關(guān)于人形是不是具身智能的最優(yōu)解,王仲遠(yuǎn)肯定了人形機(jī)器人的長期價(jià)值:“社會(huì)基礎(chǔ)設(shè)施為人類設(shè)計(jì),雙足構(gòu)型更易融入,且海量人類行為數(shù)據(jù)利于模型訓(xùn)練?!?/p>

但短期內(nèi)四足、輪式等形態(tài)將共存,“??人形機(jī)器人的成熟周期更慢??,今年剛學(xué)會(huì)跑,穩(wěn)定性仍需突破?!彼f道。

??數(shù)據(jù)悖論如何解??? 面對(duì)“硬件能力不足限制數(shù)據(jù)采集,數(shù)據(jù)稀缺又制約模型進(jìn)化”的循環(huán)困局,王仲遠(yuǎn)認(rèn)為,可以通過互聯(lián)網(wǎng)視頻數(shù)據(jù)訓(xùn)練基礎(chǔ)能力,再以少量真實(shí)數(shù)據(jù)強(qiáng)化學(xué)習(xí)微調(diào)?!熬拖窈⒆涌匆曨l學(xué)會(huì)串藍(lán)莓,再動(dòng)手實(shí)踐優(yōu)化動(dòng)作?!?/p>

??工廠場(chǎng)景為何優(yōu)先??? “封閉環(huán)境可規(guī)避安全風(fēng)險(xiǎn),且重復(fù)枯燥任務(wù)存在剛需。”他舉例物流分揀、激光刻印等場(chǎng)景,“這些人類不愿做的工作,正是具身智能首個(gè)突破口”。

對(duì)于業(yè)內(nèi)熱炒的“大小腦融合”概念,王仲遠(yuǎn)表示,智源不否認(rèn)大小腦融合的可能趨勢(shì),未來5-10年,大小腦融合的模型可能會(huì)成熟,但不是今天。

他直言,當(dāng)前具身智能數(shù)據(jù)量不足以支持大小腦融合的模型訓(xùn)練。

目前,具身智能的VLA模型泛化性不夠,也許能把咖啡端得很好,但并不能很好地解決其他泛化任務(wù)。王仲遠(yuǎn)認(rèn)為,具身智能或者機(jī)器人2.0時(shí)代,最重要的是能突破專有任務(wù),達(dá)到一定的泛化性,再到未來具備更通用、跨領(lǐng)域的泛化性,這需要一定的發(fā)展過程。

他判斷,2006-2022年的深度學(xué)習(xí)或者AI 1.0時(shí)代,人工智能的發(fā)展路徑是首先在某項(xiàng)能力上超越人類,然后進(jìn)入到生產(chǎn)生活應(yīng)用,積累了越來越多的數(shù)據(jù),再隨著算力、算法、數(shù)據(jù)達(dá)到一定程度,推動(dòng)大模型的產(chǎn)生,隨后,發(fā)現(xiàn)其具備了通用人工智能和跨領(lǐng)域的可能性?!癡LA以及真正意義上端到端的具身大模型,需要時(shí)間沉淀?!?/p>

AGI剛過起跑線

MCP、Agent成為人工智能領(lǐng)域最新話題,這是否意味著AI有了實(shí)質(zhì)性突破,以及AGI到底走到了哪一步?

王仲遠(yuǎn)認(rèn)為,大模型發(fā)展到一定程度,達(dá)到可用狀態(tài)之后,Agent是產(chǎn)業(yè)界可以開始發(fā)力的領(lǐng)域。

“基礎(chǔ)大模型達(dá)到可用狀態(tài)時(shí),像水、電、操作系統(tǒng)一樣,意味著可以基于這個(gè)操作系統(tǒng)開發(fā)很多APP?,F(xiàn)在的Agent相當(dāng)于移動(dòng)互聯(lián)網(wǎng)的APP,目前手機(jī)上很多APP也是工作流,但是越來越強(qiáng)時(shí)就能擴(kuò)展能力?!彼赋?,現(xiàn)在大模型的思考能力和智能化程度已經(jīng)實(shí)現(xiàn)使得部分Agent做得很好,這是產(chǎn)業(yè)界特別擅長和優(yōu)勢(shì)所在,這是產(chǎn)業(yè)發(fā)展的趨勢(shì)。

王仲遠(yuǎn)表示,此前“百模大戰(zhàn)”討論的是基礎(chǔ)大模型的競(jìng)爭,但是基礎(chǔ)大模型一定會(huì)收斂,現(xiàn)在可以看到行業(yè)內(nèi)還剩下少數(shù)幾個(gè)玩家在堅(jiān)持基礎(chǔ)大模型,這在某種程度上不會(huì)造成資源浪費(fèi)。

將來有沒有可能出現(xiàn)新的“千模大戰(zhàn)”或者“萬模大戰(zhàn)”?王仲遠(yuǎn)并不排除這種可能性。他說,因?yàn)榛A(chǔ)大模型進(jìn)入產(chǎn)業(yè),需要產(chǎn)業(yè)相關(guān)的數(shù)據(jù)衍生出垂類模型,但垂類模型并不是指垂類領(lǐng)域訓(xùn)練,而是基于好的基座模型+垂類數(shù)據(jù),訓(xùn)練出好的產(chǎn)業(yè)模型。

“具身大模型的發(fā)展仍處于非常早期的階段,類似于GPT-3前的探索期?!蓖踔龠h(yuǎn)分析指出,當(dāng)前具身智能也面臨與早期AI大模型類似的挑戰(zhàn)。

比如,技術(shù)路線尚未形成共識(shí):學(xué)界與產(chǎn)業(yè)界對(duì)核心技術(shù)路徑存在分歧,仿真數(shù)據(jù)、強(qiáng)化學(xué)習(xí)、大小腦融合架構(gòu)等方向仍在探索中,尚未形成統(tǒng)一方法論;又如產(chǎn)業(yè)落地尚需突破:盡管智源推出具身智能跨本體大小腦協(xié)作框架等成果,但離大規(guī)模商用仍有較長距離,需要解決“感知-決策-行動(dòng)”協(xié)同、多模態(tài)數(shù)據(jù)融合等基礎(chǔ)問題。

或許,當(dāng)機(jī)器人能真正理解“咖啡杯放桌沿會(huì)摔碎”時(shí),才是物理AGI的里程碑。(21世紀(jì)經(jīng)濟(jì)報(bào)道 記者 孔海麗)

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。

熱新聞