在阿里通義千問模型Qwen3(簡稱千問3)模型開源數(shù)小時后,華為官方宣布昇騰支持千問3全系列模型部署,開發(fā)者在MindSpeed和MindIE中開箱即用,實現(xiàn)千問3的0Day適配。
據(jù)悉,千問3是國內(nèi)首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案,對復雜問題可多步驟“深度思考”,大大節(jié)省算力消耗。華為官方表示,千問3的旗艦?zāi)P?Qwen3-235B-A22B 在代碼、數(shù)學、通用能力等基準測試中,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活參數(shù)數(shù)量是 QwQ-32B 的 10%,表現(xiàn)更勝一籌,甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。
此前華為昇騰就一直同步支持千問系列模型。昇騰MindSpeed訓練、MindIE推理支持千問2.5、兼容主流生態(tài)的分布式并行接口等,千問3系列模型一發(fā)布即實現(xiàn)低代碼無縫遷移。