7月22日,阿里云通義千問Qwen大模型官方賬號(hào)公布對(duì)旗艦版Qwen3模型進(jìn)行了更新,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。此次更新,涵蓋指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等多個(gè)關(guān)鍵領(lǐng)域。

資料顯示,新的Qwen3模型通用能力顯著提升。在GQPA(知識(shí))、AIME25(數(shù)學(xué))、LiveCodeBench(編程)、Arena-Hard(人類偏好對(duì)齊)、BFCL(Agent 能力)等測(cè)評(píng)里,它超越了Kimi-K2、DeepSeek-V3等開源模型,以及Claude-Opus4-Non-thinking等閉源模型。

不僅如此,新版Qwen3在關(guān)鍵性能方面實(shí)現(xiàn)了進(jìn)一步增強(qiáng)。在多語(yǔ)言的長(zhǎng)尾知識(shí)覆蓋上取得重要突破,極大地豐富了知識(shí)儲(chǔ)備;在主觀及開放性任務(wù)處理中,更能精準(zhǔn)契合用戶偏好,生成的回復(fù)實(shí)用性更強(qiáng),文本質(zhì)量也更高;長(zhǎng)文本處理能力提升至256K,上下文理解能力得以進(jìn)一步強(qiáng)化,能夠更好地應(yīng)對(duì)復(fù)雜內(nèi)容。
目前,Qwen3新模型已在魔搭社區(qū)和HuggingFace上開源更新。