2024年,是AI技術飛速發展的一年,AI從單一任務向多模態、多任務實現了跨越,大模型市場從拼參數的“百模大戰”到了拼落地、拼應用的新階段。AI應用在多個行業逐步深化,大模型則推動了傳統產業變革,為新質生產力賦能,對各行各業都產生了深遠的影響。隨著中國人工智能的飛速發展,AI已經變成了我們生活里的一部分。
2024年,對MiniMax公司而言是充滿挑戰與收獲的一年。我們堅持技術創新,在文本、圖像、語音&音樂、視頻等多個模態的模型算法發力,力求實現技術突破,加快實現通用人工智能的步伐。在文本模型上,我們在上半年就推出了國內首個上線商用的MoE架構、包含萬億參數的大語言模型abab 6.5。在多模態領域,MiniMax語音大模型speech-01已經實現了世界Top 2大規模商用,同時推出了國內首個可以對標OpenAI的Realtime API服務,提升了端到端實時多模態處理能力。去年下半年,MiniMax推出的視頻模型video-01在國際多個權威榜單評測得分領先,受到超過200個國家和地區創作者的好評。
回望過去一年,我們走過彎路,也總結了很多經驗。我們發現,AI時代不能套用上一代移動互聯網產品方法論來思考新產品。AI大模型和產品的真實關系是更好的模型可以導向更好的應用,但更好的應用和更多用戶并不會導向更好的模型。也正因把技術迭代設立為了核心目標,我們才成為了中國大模型公司中,為數不多的能不依賴于推廣,以好技術為替代來驅動好產品,并在全球收獲相對還不錯的口碑的公司,這是我們2024年的幸運。
2025年是AI行業發展的關鍵一年,也是AI Agent大放異彩的時代。新的一年,加速技術迭代仍是MiniMax最重要的目標。新年伊始,我們接連發布了提供主體參考功能的視頻模型S2V、新一代開源模型MiniMax-01,以及在多語種表現優異的語音模型T2A-01-HD。選擇對MiniMax-01開源,一是因為我們認為這有可能啟發更多長上下文的研究和應用,從而更快促進Agent時代的到來,二是開源也能促使我們努力做更多創新,更高質量地開展后續的模型研發工作。
長上下文能力與多模態處理能力的提升,是AI Agent為各行業帶來更為豐富、高效、智能的解決方案的必要條件。現在,我們邁出了建立復雜Agent基礎能力的第一步。在機遇和挑戰并存的未來,MiniMax會繼續堅持技術驅動,把每一步做扎實,才能推動AI技術在更多領域的落地,為AGI的更快到來盡全力。(經濟觀察報 記者 任曉寧)