IT之家模型更新

轉戰閉源遇挑戰:消息稱 Meta 一再推遲上線 AI 模型 Muse Spark

2026年6月4日 15:19
轉戰閉源遇挑戰:消息稱 Meta 一再推遲上線 AI 模型 Muse Spark

重點摘要

根據《華爾街日報》報導,Meta 公司最強 AI 模型「Muse Spark」開發遭遇阻礙,已多次延後上線時程。截至目前,該模型仍未對開發者開放 API 進行調用。

站內 AI 整理稿

## 轉戰閉源遇挫!Meta最強AI模型「Muse Spark」API三度延期,開發者期待落空

Meta全力押注的閉源AI模型Muse Spark,再度傳出上線卡關的消息。根據《華爾街日報》6月3日的報導,Meta這款被寄予厚望的模型,向開發者開放API的計畫已多次推遲,至今仍無確切的發布時間表。這不僅讓開發者社群感到不耐,也為Meta將鉅額AI投資轉化為實際收入的願景蒙上一層陰影。

### Muse Spark的背景:從廢墟中重建的閉源旗艦

要理解這次延遲的嚴重性,得先回顧Muse Spark的誕生背景。這款模型於2026年4月8日正式發表,是Meta旗下「超級智能實驗室」成立九個月以來的首個產品。該實驗室由Meta以約143億美元天價延攬前Scale AI執行長汪滔領軍,目的就是要徹底扭轉Meta在AI競賽中的劣勢。

在此之前,Meta的開源模型Llama 4曾爆發基準測試作弊的爭議,聲譽嚴重受損,導致團隊被全面整頓、路線被迫轉向。Muse Spark正是這場「砍掉重練」之後的第一張成績單,也是Meta從長期高舉開源大旗,轉向閉源商業化路線的關鍵標誌。從基準測試來看,Muse Spark在多項指標上與OpenAI的GPT-5.4、Google的Gemini 3.1 Pro互有勝負,特別是在多模態理解與健康領域表現突出,但整體仍被第三方平台評為業界第四名。

### 一再延遲:從4月到6月,開發者仍在等待

這款象徵Meta策略轉向的旗艦模型,在上線過程中卻是一波三折。知情人士透露,Meta原本預計在4月推出Muse Spark時,同步向開發者開放API,但測試過程中發現漏洞,加上基礎設施仍有待補強,導致時程從4月延到5月,再從5月延到6月。到了6月初,官方仍舊拿不出確定的發布日期。

諷刺的是,Meta AI負責人汪滔在4月發布模型時,曾在社群平台X上宣稱「Muse Spark API即將推出」,如今這句話說出口已將近兩個月,開發者只能繼續等待。TechNews的報導以「開發者耐心快磨光了」來形容這股日益升高的不滿情緒。

對於一再延期的質疑,Meta發言人向路透社回應表示,公司已與部分早期合作夥伴開始測試API,並「期待在本月正式發布」。然而在官方給出具體日期之前,市場與開發者社群仍傾向以保留態度觀望。

### 閉源轉向的商業化考驗:API為何如此重要?

外界之所以高度關注這次API延遲,與Meta策略轉向的本質有直接關係。與過去開源的Llama系列不同,Muse Spark採取閉源路線,意味著模型的核心權重和技術細節不對外公開。在此模式下,開發者要使用這款模型的唯一途徑,就是透過API調用。換句話說,API不只是個「附加功能」,而是Meta從開源社群貢獻者轉型為AI服務供應商的關鍵門戶。

如果API無法如期上線,Meta不僅難以向開發者生態證明模型的實用價值,也無法展開後續的收費商業模式。而華爾街更關注的是:Meta過去一年在AI基礎設施上投入的鉅額資本支出,究竟要等到何時才能開始產生具體回報?每一次的延遲,都意味著投資人期待的AI營收成長時間點往後推遲。

### 組織整頓與人才競爭的內耗代價

Muse Spark的難產,也反映出大規模組織重組所伴隨的陣痛。汪滔在4月發布時曾坦言,過去九個月團隊「從一片空地上」重新建構了整個AI系統框架與算力基礎設施,推翻了過往的諸多做法。這種從無到有的重建,雖然帶來了全新技術架構,卻也讓團隊在整合、測試與基礎設施擴建等環節耗費了超乎預期的時間。

知情人士指出,本次延期的主因包括測試階段發現的漏洞,以及基礎設施仍需進一步擴充。換句話說,即便模型本身在基準測試中交出亮眼的成績單,但要將其打造成穩定、可規模化對外服務的產品,Meta顯然還有一段路要走。這也凸顯了AI實驗室與商業產品之間的巨大鴻溝——光有強大的模型遠遠不夠,從模型到服務的每一步都可能成為卡關的節點。

### 競爭加劇與市場壓力

延期的時間點,對Meta來說格外敏感。Google已將Gemini模型全面整合至搜尋與雲端服務,OpenAI正準備進行首次公開募股,持續推出更新,連SpaceXAI也以合併後的巨大估值準備加入戰局。在競爭對手頻頻出招之際,Meta的API一再跳票,無疑讓外界對其執行力產生更多質疑。

而更根本的挑戰在於,Meta過去長期以開源路線吸引開發者,Llama系列累積了龐大的社群基礎。如今轉向閉源後,能否說服這些開發者付費使用Muse Spark的API,本身就是一項艱鉅的任務。現在API又遲遲無法上線,等於連說服的機會都還沒來得及創造,就已經讓不少開發者失去耐心。

### 讀者可以關注的後續發展

關於Muse Spark的後續進展,有幾個方向值得持續追蹤。首先是Meta是否能在6月內如期推出API,這將是檢驗官方說法能否兌現的第一個指標。其次,API正式上線後的定價策略與使用門檻,將直接反映Meta在閉源商業化路線上的實際意圖。此外,Muse Spark下一代版本的開發進度,也是Meta能否逐步補齊與第一梯隊差距的關鍵觀察點。最後,投資人與市場對Meta AI支出回報的檢驗力道,可能會隨著延遲次數增加而持續升溫。

對台灣讀者而言,這場AI大廠的策略轉折與產品延遲,也提醒了我們:在追求模型性能突破的同時,從實驗室到商業應用的落地能力,往往才是決定成敗的真正戰場。

Related

相關文章

收費才是DeepSeek的“成人禮”

這篇消息聚焦「收費才是DeepSeek的“成人禮”」。原始導語提到:豆包先給DeepSeek探探路。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

55 分鐘前
Hugging Face Blog模型更新

如何針對您的語言、領域或口音微調 Nemotron 3.5 ASR

NVIDIA 推出 Nemotron 3.5 ASR,這是一個具備 6 億參數的串流多語言語音轉文字模型,能從單一檢查點即時轉錄 40 種語言區域,並內建標點符號與大小寫功能。它繼承了今年稍早於 Hugging Face 及 NIM 發布的 Nemotron 3 ASR(僅支援英文)模型,後者已獲得人工智慧分析獨立基準測試的驗證。

4 小時前
雷峰網模型更新

何小鵬內部講話曝光,「最美」機器人量產時間表出來了?

機器人能不能規模化穩定交付,是整個行業的生死問題。 作者丨李希 編輯丨馬曉寧 “4季度一定要把量產做出來。”在近日的一場小鵬機器人量產動員大會上,何小鵬給內部團隊定下了一條極具壓迫感的時間線:2026 年四季度完成量產,2027 年一季度進入國內汽車門店導購場景,2027 年二季度開始進入海外市場。這場講話裡,何小鵬反覆強調的並不是 Demo、視頻或者模型參數,而是三個關鍵詞:“量產、全棧自研、跨域融合”。如果把過去兩年的具身智能行業理解為“模型秀場”,那麼小鵬這場內部講話,更像是一場真正的製造業動員令。我們認為,小鵬正在試圖把機器人,按照“造車邏輯”重新做一遍。01何小鵬說了哪些話小鵬去年年底發佈的全新一代人形機器人 IRON 相當矚目,一度被稱為“最美”機器人。除了量產時間表外,何小鵬表示,小鵬機器人是全國唯一一家全領域自研、跨界融合的機器人廠商。而且小鵬的自研深度很深。小鵬汽車花了5年的時間做自研,才能把第一個版本做到行業水平,再花5年時間才能把多個不同能力的跨域進行融合。而如果做簡單的產品定義與集成自研,你就永遠做不到跨域融合。(因為)你永遠會看到其他人給你提的需求,你再去找供應商商量,供應商說做不到,你就做不到了。所以何小鵬在會場堅決表態,小鵬要成為機器人中的蘋果,從芯片到操作系統、從關節到手都要做到自研,這樣才有可能做到不一樣。當然前期的投入時間難度特別大,但是想象力、創新力和改造力也特別不一樣。這款量產機器人,會是一款什麼樣的機器人?何小鵬給的產品定義是,小鵬正在走出一條不一樣的產品和商業路線。小鵬的機器人是一個優雅、美、安全的機器人,是一個能夠跟人近距離交互的機器人。02從“機器人 Demo”到“機器人工程”何小鵬在講話中回憶了小鵬汽車早期自動駕駛研發時的經歷。當時團隊曾經認為,“硬件先做,軟件後面 OTA 即可”,但後來發現,零下 30 度起霧、電磁幹擾、

7 小時前
雷峰網模型更新

CVPR 2026:深度學習的「標準件」,正在被逐個拆掉

注意力的浮點精度不是必須的,歸一化流的"精確可逆"是可以放棄的…… 作者丨馬曉寧 編輯丨岑 峰 這裡有一幢大樓,叫做深度學習。過去幾年,人們不停地給它加蓋、擴建,越蓋越高,越蓋越複雜。這幢大樓叫 Transformer。蓋樓時用了一大批標準件,浮點精度是它的鋼筋,層歸一化和殘差連接是它的混凝土,因果掩碼是它的承重隔斷。旁邊還有兩棟附樓:一棟是擴散模型;另一棟歸一化流。在漫長的施工期裡,人們不斷加裝更粗的鋼筋、更復雜的控制系統,以為這樣做就能讓這幾棟樓更穩固高大美觀。但是這樣真的是對的嗎?可現在,這些施工的收益越來越小,而有人在附樓裡試出了更好的新零件,量化、去噪、可逆約束都有了更輕便的替代品。於是,一批施工隊同時進場,對準這些標準件開刀。他們不是來修修補補的,而是問一個更根本的問題:這根柱子、這面牆、這套管道,到底是真承重,還是隻因為一直在那兒所以沒人動?更有意思的是,五支施工隊去了不同的樓層。有的在樓體外牆動手,拆掉了那些只用來裝飾的預製板——那是推理端的精度和定製策略。有的鑽進設備層,重新鋪設了管線——那是訓練目標的參數化方式。還有的直接下到地下室,對著地基裡的鋼筋動起了大錘——那是歸一化層和可逆性約束。把它們放在一起看,你會發現一條清晰的遞進線:深度學習的"標準件"正在從外圍到核心,被逐個拆掉。01從推理端開刀:精度和定製策略,不是必須的最先被質疑的標準件,是那些看起來最"技術性"的,比如說,浮點精度的矩陣乘法,和針對不同架構手工調參的量化策略。這些因為不涉及“模型為什麼能work”的核心設計哲學,看起來只是優化效率、節省算力,所以最容易被人當成“普通的工程優化”。但 CVPR 2026 的這兩篇論文告訴我們,遠不止"模型可以更省"這麼簡單。▎BinaryAttention:1-bit 注意力,比全精度還能打Transformer 的注意力模塊一直是算力黑洞。Quer

7 小時前