中國人工智能初創企業MiniMax發佈全新AI模型M2.1,再次向全球生成式AI競爭發起挑戰。該模型顯著強化了編程語言多樣化與實際工作環境應對能力,不僅在代碼輔助方面,在文檔撰寫、對話應答中也展現出全面提升的性能。

此次發佈的M2.1通過超越前代模型M2的性能升級,大幅提升了對多種編程語言的理解度與生成準確度。支持語言已擴展至Rust、Java、Go、C++、Kotlin、Objective-C、TypeScript、JavaScript等,其在Web、Android、iOS平臺的用戶界面設計與美學構成能力也獲得了顯著改進的評價。

尤爲突出的是,M2.1不僅強化了簡單代碼執行的正確性,其解讀與遵循複雜任務指令或詳細指南的能力也得到增強,從而構建出更貼合實際辦公環境的AI。MiniMax爲此提升了模型的對話能力與文檔撰寫能力,並說明其從日常對話到技術文檔撰寫與結構化應答的廣泛範圍內均表現出優異性能。

AI代理開源平臺Kilo Code的聯合創始人兼首席執行官Scott Breitenother表示:“在初期測試中,M2.1在架構設計、代碼編排、評審、部署等整個開發流程中均展現出非常出色的成果”,並評價該模型同時滿足了成本效益與高水平性能。

此模型還通過名爲VIBE(Vision and Interactive Benchmark for Execution)的新基準指標進行評估。VIBE基於Web、模擬、Android、iOS、後端開發五個核心領域構建,通過基於代理的驗證語言對生成結果的交互邏輯與視覺元素進行綜合判斷。據MiniMax介紹,M2.1在該基準測試中獲得平均88.6分,其中在Web和Android領域分別取得了91.5分和89.7分的優秀成績。

M2.1也與主流AI模型進行了性能比較。在與Anthropic、谷歌、OpenAI、DeepSeek等主要廠商的主力模型並列評估的結果中,M2.1在“Humanity’s Last Exam”和“Toolathon”等高難度基準測試中也展現出強大的問題解決能力。尤其在HLE w/o Tools項目中獲得22.0分,在MMLU(Pro)/人文·科學·技術領域綜合測試中獲得88分,與頂級AI模型陣營比肩。

M2.1目前可通過MiniMax自有API或Hugging Face下載,公司代表服務MiniMax代理也基於M2.1運行。此次模型發佈顯示出多語言編碼支持與AI代理市場正加速演進,也預示着源自中國的生成式AI的通用性與競爭力正在持續擴大。