經濟觀察報 陳奇杰 任曉寧/文 3月31日,智譜在中關村論壇上發布其最新智能體(Agent)產品AutoGLM沉思。這款產品結合了深度研究能力和操作能力,強調邊想邊干,即一邊思考一邊幫助用戶完成復雜問題。
智譜CEO張鵬在發布會上表示,大模型的預訓練和后訓練存在Scaling Law(規模定律)。智譜發現,Agent也存在類似的Scaling Law。通過擴展訓練時的inference compute(推理計算),智譜觀察到Agent展現出了更強的性能。
Scaling Law是描述模型性能如何隨著模型規模(如參數數量)、訓練數據集大小以及用于訓練的計算資源增加而提升的一組經驗法則,被業界認為是大模型預訓練第一性原理。
張鵬說,在Agent Scaling Law的基礎上,智譜進一步發現了Agent也存在能力涌現。例如,盡管智譜在訓練過程中從未教給AutoGLM沉思訪問巨潮資訊網,但當發送指令“幫我收集昨天關于具身智能的相關研報”時,AutoGLM沉思能夠規劃出通過訪問巨潮資訊解決問題的方案,并順利操作了網站。
張鵬在現場還演示了AutoGLM沉思更多的能力,它可以像人類一樣打開并瀏覽網頁,完成數據檢索、分析,并生成萬字報告。此外,當用戶要求AutoGLM沉思賺錢時,它可以自主選擇通過寫稿掙錢,并完成從上網搜索征稿啟事、根據要求構思寫稿、通過郵件向平臺投稿獲取稿費等一系列操作。
張鵬稱,AutoGLM沉思的能力實現依賴于三個關鍵技術:一是深度思考,能夠模擬人類在面對復雜問題時的推理與決策過程;二是感知世界,能夠像人一樣獲取并理解環境信息;三是工具使用,能夠像人一樣調用和操作工具,完成復雜任務。
同時,與一般的推理模型不同,AutoGLM沉思的思維鏈更長,會一直不斷地思考、反思、糾錯,再加上調用工具,以至于完成一項任務的時長有時長達10分鐘以上。
據張鵬介紹,AutoGLM沉思背后是智譜GLM全棧自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中前者不僅性能比肩DeepSeek-R1,在速度提升最高8倍的同時,價格還僅需DeepSeek-R1的1/30。智譜將于4月14日開源基座模型GLM-4-AIR、推理模型GLM-Z1-Air、沉思模型GLM-Z1-rumination。