6月20日,在華為開發者大會2025(HDC 2025)上,全新發布基于盤古多模態大模型的世界模型,可以為智能駕駛、具身智能機器人的訓練,構建所需要的數字物理空間,實現持續優化迭代。
在火星探測領域,盤古世界模型能夠基于單張火星地表圖片,生成高精度的數字物理空間。借助這一技術,火星車可以模擬真實任務場景,通過分析環境中的距離和角度信息,預判可能的物理碰撞并訓練避障能力;同時,通過對數字空間中巖石的抓取模擬,還能提升機械臂的操作能力。
在智能駕駛領域,輸入首幀的行車場景、行車控制信息和路網數據,盤古世界模型就可以生成每路攝像頭的行車視頻和激光雷達的點云,能夠為智能駕駛生成大量的訓練數據,而無需依賴高成本的路采。廣汽集團與華為云深度合作,依托盤古多模態大模型,實現了2D視頻模態與3D點云模態的像素級對應,在數分鐘內即可完成復雜場景Corner case的復原,為端到端模型“兩天一個版本”的高效迭代提供了強力支撐。
盤古世界模型的發布,有助于進一步推動數字世界與物理世界深度融合,加速人工智能技術在更多復雜場景中落地應用,為人們探索未知領域和構建智能社會創造更多可能。