雷峰網生成式AI

面壁智能「開源周」:一場定義端側 AI 終局的系統性「亮劍」

2026年6月4日 10:09

重點摘要

一場罕見的「技術組曲」。 作者丨馬曉寧 編輯丨林覺民 難得能遇到一次大模型開源周。5 月 25 日至 29 日,面壁智能聯合 OpenBMB 開源社區,以每日發佈一項關鍵技術成果的節奏,舉辦了一場「端側大模型開源周」。這在中國乃至全球的大模型公司中,都是一次極為罕見的集體「亮劍」。從適配國產昇騰、未來有望將 600 億參數大模型裝進手機的 1.58-bit 低比特訓練大模型 BitCPM-CANN,到性能超越兩倍參數模型、全球同級最優的 MiniCPM5-1B;從 AI 親手編寫、在 H100 上比英偉達自家大模型訓練框架 Megatron 更快的 ForgeTrain,到重構交互範式的智能體操作系統 PilotDeck;最後,再到揭示端側模型高效智能源頭的核心數據集 UltraData 系列……這五項成果並非孤立的「技術煙花」,而是一套環環相扣、邏輯嚴密的「技術組曲」。它們共同指向一個清晰的行業事實:端側大模型的終局之戰,比拼的不是某個單點技術的拔群,而是覆蓋數據、算法、框架、應用的全鏈路系統工程的創新總和。面壁開源周,更迫使我們重新思考:在通往 AGI 的道路上,開源的真正價值是什麼?而端側,又將在其中扮演怎樣的角色?01為何開源周如此之少翻開過去三年的歷史,面壁之外,也僅有以「效率美學」著稱的 DeepSeek 在 2024 年(6月24日-28日)進行過類似的開源周活動。此外,雖然有些公司有過一週開源三款模型的記錄,但是還未曾冠以開源周的名義。做“開源周”,通常意味著一個機構需要在短時間內(一週)集中釋放大量、系統性的技術成果。這不僅僅是數量的堆砌,更關鍵的是質量的深度和規劃的體系性。無論是DeepSeek,還是面壁的開源周案例,我們可以這樣理解:刻意將發佈壓縮在5-7天內,每天甚至半天就有新項目放出。這需要背後有充足的項目儲備和成熟的發佈節奏規劃。這次面壁的開源,

站內 AI 整理稿

一場罕見的「技術組曲」。 作者丨馬曉寧 編輯丨林覺民 難得能遇到一次大模型開源周。5 月 25 日至 29 日,面壁智能聯合 OpenBMB 開源社區,以每日發佈一項關鍵技術成果的節奏,舉辦了一場「端側大模型開源周」。這在中國乃至全球的大模型公司中,都是一次極為罕見的集體「亮劍」。從適配國產昇騰、未來有望將 600 億參數大模型裝進手機的 1.58-bit 低比特訓練大模型 BitCPM-CANN,到性能超越兩倍參數模型、全球同級最優的 MiniCPM5-1B;從 AI 親手編寫、在 H100 上比英偉達自家大模型訓練框架 Megatron 更快的 ForgeTrain,到重構交互範式的智能體操作系統 PilotDeck;最後,再到揭示端側模型高效智能源頭的核心數據集 UltraData 系列……這五項成果並非孤立的「技術煙花」,而是一套環環相扣、邏輯嚴密的「技術組曲」。它們共同指向一個清晰的行業事實:端側大模型的終局之戰,比拼的不是某個單點技術的拔群,而是覆蓋數據、算法、框架、應用的全鏈路系統工程的創新總和。面壁開源周,更迫使我們重新思考:在通往 AGI 的道路上,開源的真正價值是什麼?而端側,又將在其中扮演怎樣的角色?01為何開源周如此之少翻開過去三年的歷史,面壁之外,也僅有以「效率美學」著稱的 DeepSeek 在 2024 年(6月24日-28日)進行過類似的開源周活動。此外,雖然有些公司有過一週開源三款模型的記錄,但是還未曾冠以開源周的名義。做“開源周”,通常意味著一個機構需要在短時間內(一週)集中釋放大量、系統性的技術成果。這不僅僅是數量的堆砌,更關鍵的是質量的深度和規劃的體系性。無論是DeepSeek,還是面壁的開源周案例,我們可以這樣理解:刻意將發佈壓縮在5-7天內,每天甚至半天就有新項目放出。這需要背後有充足的項目儲備和成熟的發佈節奏規劃。這次面壁的開源,從最底層的 Infra 創新(BMTrain、BitCPM),到數據治理(UltraData),再到模型算法(MiniCPM、VoxCPM)和上層應用(PilotDeck、松果派、法律大模型、智能座艙等),面壁智能的佈局並非單點突破,而是圍繞「端側」這一核心目標,進行的前瞻性、體系化構建。雲端大模型的核心壁壘在於「規模」,比如更多的卡、更多的數據。而端側大模型的壁壘則在於「系統性協同」的複雜度。面壁智能的這場開源周,本質上就是一次「完整技術棧的專場展覽」。這些開源項目不是孤立的,而是串聯了算法層、基礎設施層、應用層三個環環相扣的技術層級。開源周讓所有人看到,這不僅僅是五個獨立項目,而是一套可以復現的、經過驗證的、端到端的國產端側大模型解決方案。五天五連發是開源周的標配,從DeepSeek和麵壁的例子來看,單一模型遠遠不夠,而是一套技術棧組合。因為單點開源一個模型可能只是「運氣」,但能開源一整套訓練-推理-部署-數據工具鏈,證明了組織具備完整、先進的工程體系能力。如果一家機構技術儲備不足卻強行「造周」,可能發佈的就只有一些維護性更新或文檔,第一天期待被拉高後,後面幾天質量就呈現除了斷崖式下跌的趨勢,反而是對口碑的極大損害。從一次開源週上,我們也可以得出這樣的結論,能穩定輸出「一週成果」,說明內部有多個並行項目處於可發佈狀態,那麼這家公司的研發流程工業化程度也是堪稱典範。02十年一劍,霜刃可試如果說,開源周的五項發佈,揭秘了其在端側 AI 賽道上深不可測的「內功」,持續的開源,則展現了面壁智能的格局。早在 2022 年,當國內對大模型的認知還普遍處於混沌初開之際,由清華大學 THUNLP 實驗室與面壁智能聯合發起的 OpenBMB 開源社區,就已開啟了中國最早的、全鏈路的大模型開源探索。同年 7 月,OpenBMB 開源社區推出的免費「大模型公開課」,幾乎成為國內第一批大模型從業者的「啟蒙教程」,累計播放量達數百萬。他們也是國內最早直播大模型訓練過程的社區,對培養中國的大模型人才梯隊、塑造開放的技術氛圍,貢獻卓著。這種堅守,也體現在成果的「含金量」上:在 2024 年 Hugging Face 統計全球最受歡迎大模型時,OpenBMB 開源社區的模型下載量位列中國區第一。時至今日,其 GitHub 星標已超過 13 萬,位列全球開源組織前一百;MiniCPM 系列模型全球下載量突破 3000 萬次,UltraData 數據集下載量也超過 400 萬次。這些數字的背後,是全球開發者真金白銀的「投票」,也是其開源貢獻得到國際認可的最好證明。更重要的是,面壁智能的開源,是一種體系化的、毫無保留的「真開源」。此次開源周,他們不僅開源了模型(MiniCPM5-1B),還開源了模型背後的「生產線」(ForgeTrain)、「核心工藝」(BitCPM-CANN)、「原材料」(UltraData),乃至「智能體操作系統」(PilotDeck)——這在全球範圍內都極為罕見。「何為真正的開源精神」,長達數年的持續投入和一次毫無保留的集中展示,這就是開源精神。03端側智能的未來端側大模型的技術,要求在算法、軟件、硬件、數據之間找到一個極致精妙的平衡點。這需要對模型壓縮(如 BitCPM-CANN 的1.58-bit QAT)、高密度數據治理(如 UltraData)、軟硬協同(適配國產算力)、高效推理框架(CPM.cu)、前沿智能體(PilotDeck)等多個領域都有世界級的認知和積累。這是一個「精工細作」的領域。單點能力的突出,遠不如全鏈路的協同優化來得重要——這道系統性的門檻,是端側 AI 賽道難以被輕易超越的真正原因。圖注:2026 年 5 月,面壁智能新一代「小鋼炮」MiniCPM5-1B 的性能就已超越 GPT-4o 的部分版本能力端側模型正在以驚人的速度,逐步「吞噬」原本屬於雲端模型的專屬能力領地。如果這一趨勢持續,整個 AI 行業的底層邏輯將被徹底改寫:▪ 價值鏈的重構AI 的核心價值,將從提供雲端 API 的公司(如 OpenAI、Google),大規模地轉移到控制終端的硬件廠商(如蘋果、高通、聯想)和掌握端側 AI「操作系統」的公司。屆時,誰能提供最高效、最普適的端側 AI 解決方案,誰就掌握了下一代計算平臺的「靈魂」。▪ 應用範式的革命「離線可用」、「零延遲」、「絕對隱私」將不再是奢侈品,而是 AI 應用的基礎標配。能夠常駐在個人設備中的智能體,將重塑我們與數字世界交互的每一個環節,真正的「數字伴侶」將成為現實。▪ 商業模式的顛覆按 Token 計費的模式將被削弱,取而代之的,可能是類似傳統軟件的授權費,或是與硬件綁定的「一次性買斷」。這將極大地降低普通用戶使用先進 AI 的門檻,引爆真正的 C 端應用大爆炸。這不僅是一場技術路線的演進,更是一場權力與價值的遷移。而在這場即將到來的地殼運動中,已經領先兩年的面壁智能,無疑佔據了最有利的戰略位置。雷峰網消息

Related

相關文章

Hugging Face Blog生成式AI

Nemotron 3.5 內容安全:為全球企業 AI 打造可自訂的多模態安全防護

回顧過去兩年,NVIDIA 的內容安全技術棧已從一個專注於英文的分類器,發展為一系列專業模型,逐步擴展至新的模態、語言與推論模式。2026 年 3 月推出的 Nemotron 3 Content Safety 首次在單一 4B 參數模型中整合多模態與多語言能力。今日我們發布 Nemotron 3.5 Content Safety,補齊最後一塊拼圖:一個統一處理多模態輸入的單一模型。

11 分鐘前
IT之家生成式AI

全球最強開源生圖 AI 模型:Ideogram 4.0 登場

Ideogram 於6月3日正式發表4.0版本,這是一款採用開放權重架構的文字轉圖片生成模型,官方宣稱其為「全球最佳開源生圖AI模型」。開發人員與研究人員可下載模型權重進行本地部署與二次開發,此舉有望進一步拉高開源模型的品質天花板。

5 小時前
雷峰網生成式AI

全球首個!材科源圖發佈有機高分子應用智能體

在人工智能重塑科研範式的科技浪潮中,因體系複雜、配方變量多,長期面臨高度依賴專家經驗、試錯成本高、知識難以沉澱複用等行業瓶頸,研發效率提升亟待突破。近日,據雷峰網瞭解,蘇州材科源圖(MatSource)正式發佈全球首個有機高分子材料研發應用智能體(Organic Polymer Agent)。該智能體依託自主構建的通用材料科學智能體框架(Materials Agent Framework),面向高分子材料研發場景打造專家級人工智能系統,推動“人工驅動”向“人工智能協同驅動”加速躍遷,為高新材料的高效自主研發提供了關鍵的技術支撐。01 面向複雜研發場景,構建高分子材料研發“智能中樞”作為材科源圖(MatSource) 材料科學智能體體系的重要組成部分,有機高分子應用智能體聚焦高分子材料研發中的關鍵痛點,融合材料知識圖譜、多模態數據理解、大模型推理與領域機理模型能力,構建覆蓋“設計-預測-優化-決策”的全流程智能研發體系。依託這一技術架構,系統可實現高分子分子結構設計與性能預測、配方體系智能生成與多目標優化、工藝參數推薦與實驗路徑規劃,以及文獻知識解析、研發知識沉澱等核心功能,推動專家經驗向數字化能力轉化。通過“知識+模型+工具”的深度協同,顯著提升研發效率與決策質量,為行業由傳統“經驗驅動”向“智能驅動”轉型提供新的技術路徑。02 率先落地光刻膠,完成產業級驗證作為有機高分子材料中技術壁壘最高、研發難度最大的典型代表,光刻膠成為該智能體的首個驗證場景。目前,系統已完成在ArF光刻膠研發場景中的實測驗證,實現從樹脂設計、配方篩選到性能預測的全流程支持,並完成關鍵指標驗證,證明瞭其在複雜有機高分子體系中的工程化能力與應用價值。這意味著,材科源圖(MatSource)不僅驗證了“AI+高分子材料”的技術可行性,也打通了從實驗室研發到產業應用的關鍵路徑。03 從ArF到EUV,持續拓

5 小時前
雷峰網生成式AI

不卷價格和參數,中國汽車如何賣到5000萬輛?

2026年,國內新能源汽車滲透率突破60%,中國汽車品牌的售價提升到80萬元。中國乘聯會秘書長崔東樹說,國產車未來要達到5000萬輛銷售規模,在全球市場中,佔比超過50%。中國汽車越過規模大關,但高速發展之下,行業參數內卷、體驗同質化、盈利承壓等痛點日益凸顯。第四屆未來汽車先行者大會上,奇瑞副總經理王琅直言,行業進入新的“無人區”,不能再卷參數了。跳出價格與參數之外,國產車如何尋找下一個增長點?01元戎啟行周光:智駕幾十公里接管一次和1000公里接管一次,是兩個物種最近幾年,智駕行業的技術重心從端到端、VLA向著大模型、基座模型和物理AI快速迭代。元戎啟行CEO周光分享了他對物理AI基座模型的思考。他認為,過去5年,智駕行業走的是小模型路線,已經到了能力的上限,投入越來越多,提升越來越慢。這個現象可以用“蹺蹺板效應”來形容:在小模型系統裡,當一個版本解決了上海、武漢等城市的問題,可能就會在深圳、廣州等地效果變差,引入新問題。版本之間因此要反反覆覆地修改。周光說,這種蹺蹺板效應在行業中非常普遍,這也是用戶難以長期信任這個系統的原因。2026年,行業認知進入到大模型階段。周光解釋,大模型並不是一個更大的小模型,而是有一整套技術邏輯,在技術棧、網絡結構、訓練方式和模式上都有變化。他舉了一個例子,來說明大模型和小模型的認知區別。假設一條狗被染上斑馬的條紋,小模型會識別為一隻斑馬;但大模型會作出這是一隻狗的判斷。“小模型擅長條件反射、局部特徵相應,大模型擅長高級認知”,周光總結。自動駕駛從一開始的被激活,城區安全接管,再到更高的認知理解,做到像人一樣的整體判斷和泛化能力,需要從執行系統升級到認知系統。周光判斷,今年年底到明年初,行業裡會迎來從小模型到大模型、基座模型的轉換浪潮。技術陡峭升級,大模型成為智駕發展的下一個技術範式。他透露,元戎啟行很早就判斷要全面擁抱大模型和多模態,202

7 小時前
IT之家生成式AI

奧爾特曼:OpenAI 內部有人每月用掉約 1000 億個詞元

從六年前月耗十萬詞元到如今月耗千億,OpenAI 的詞元消耗量呈爆炸式增長。公司內部設有消耗排行榜,員工甚至曬圖炫耀,與亞馬遜等嚴控成本的企業形成鮮明對比。奧爾特曼承認成本已成難題,正尋求降本增效。 #AI 成本# #詞元消耗#

8 小時前