奧爾特曼：OpenAI 內部有人每月用掉約 1000 億個詞元

2026年6月4日 10:47

重點摘要

從六年前月耗十萬詞元到如今月耗千億，OpenAI 的詞元消耗量呈爆炸式增長。公司內部設有消耗排行榜，員工甚至曬圖炫耀，與亞馬遜等嚴控成本的企業形成鮮明對比。奧爾特曼承認成本已成難題，正尋求降本增效。 #AI 成本# #詞元消耗#

站內 AI 整理稿

### 重點整理：OpenAI 內部詞元消耗驚人，奧爾特曼坦言成本壓力

OpenAI 執行長山姆·奧爾特曼（Sam Altman）近日透露，公司內部已出現每月消耗約 1000 億個詞元（Token）的誇張案例，凸顯出 AI 模型運算資源的巨量使用。從六年前每月僅十萬詞元，到如今輕鬆突破千億，詞元消耗量的爆炸式成長，不僅反映 OpenAI 產品與服務的快速擴張，也暴露出背後驚人的營運成本。值得注意的是，OpenAI 內部甚至設有「詞元消耗排行榜」，員工間互相曬出使用量，彷彿將資源消耗視為一種榮譽象徵，與亞馬遜等科技巨頭嚴控成本的企業文化形成強烈對比。奧爾特曼本人也坦承，這已成為公司當前最棘手的難題之一，正積極尋求降本增效的解決方案。

### 背景脈絡：詞元消耗量與 AI 規模法則的連動

詞元是 AI 模型處理文本時的基本單位，無論是訓練模型、推理回答，還是 API 調用，每一次運算都伴隨大量詞元消耗。OpenAI 從 2015 年創立至今，模型規模從 GPT-1 的 1.17 億參數，一路成長到 GPT-4 的兆級參數，加上 ChatGPT、API 服務的廣泛應用，詞元消耗量自然以幾何級數攀升。六年前月耗十萬詞元，可能只是早期實驗室內部的測試用量；如今月耗千億，則代表 OpenAI 已成為全球規模最大的 AI 運算服務提供者之一。內部員工的「炫耀文化」，某種程度上反映出公司內部對技術資源的慷慨態度，這與傳統科技企業如亞馬遜強調「每一分錢都要花在刀口上」的方針截然不同。

### 可能影響：成本壓力將重塑 OpenAI 的營運策略

詞元消耗量的急遽膨脹，最直接的衝擊就是營運成本。每一筆 API 調用背後，都需耗費龐大的 GPU 算力與電力，奧爾特曼坦言這是「難題」，暗示現有的資源配置模式已難以持續。未來 OpenAI 可能採取多項措施：例如推出更高效的模型架構（如 GPT-4o 的精簡版本）、優化推理引擎以降低每詞元成本，或調整 API 定價結構，將高消耗用戶導向更昂貴的方案。另一方面，內部員工的「曬圖文化」也可能面臨調整——若公司開始實施資源配額或使用監控，員工的揮霍行為便需收斂。這對開發者社群而言，意味著未來的 API 使用成本可能更趨區隔化：一般用戶享有平價方案，但大量消耗者將付出更高代價。

### 讀者可關注的後續：降本進度與定價變動

接下來可密切觀察 OpenAI 的官方動態。首先，奧爾特曼是否會在開發者大會或季度報告中，公布具體的降本策略？例如減少推理階段的冗余計算、採用混合專家模型（MoE）技術等。其次，API 價格是否會出現調整？尤其在 ChatGPT 企業版與個人版訂閱之間，如何平衡成本與使用者體驗。另外，內部管理是否會引入「詞元預算」制度，讓員工與研究團隊在資源使用上更有紀律？這類措施若實施，可能影響 OpenAI 的研究效率與創新步調。對一般使用者而言，短期內或許不會感受到直接衝擊，但長期來看，AI 服務的定價與效能將更貼近「用多少付多少」的模式。

### 產業啟示：規模化之後的資源效率課題

OpenAI 的詞元消耗風波，其實是整個 AI 產業發展的縮影。過去幾年，業界信奉「規模法則」（Scaling Laws），認為模型越大、資料越多、表現越好；但這條道路正面臨資源天花板。即使像微軟、Google 擁有雄厚資本，也難以無限制擴充算力。奧爾特曼的坦言，提醒我們 AI 發展必須正視「效率」與「可持續性」——未來勝出的關鍵，不再只是誰能訓練出最大模型，而是誰能用最少的詞元產出最多的價值。這也解釋了為何 OpenAI 近期積極開發小模型（如 GPT-4o mini）與邊緣運算方案。

### 結語：資源管理將成為 AI 企業的新競爭力

從內部排行榜的炫耀，到奧爾特曼的公開承認，OpenAI 正面臨甜蜜又苦惱的成長痛。詞元消耗量的數字，不只是技術指標，更是商業模式的壓力測試。讀者不妨留意未來幾個月 OpenAI 是否推出降本成果，例如更低成本的 API 方案或更聰明的使用限制。這不僅關係到開發者的錢包，也將影響整個 AI 生態系的資源分配邏輯。奧爾特曼能否在「規模」與「成本」之間找到平衡，將是決定 OpenAI 下一階段競爭力的關鍵。

原始來源：IT之家 ↗

查看原始來源

36氪生成式AI

專家預測年底才到，Claude Mythos今天就跑出3小時6分

這篇消息聚焦「專家預測年底才到，Claude Mythos今天就跑出3小時6分」。原始導語提到：AI加速，超乎想象！從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

Hugging Face Blog生成式AI

Nemotron 3.5 內容安全：為全球企業 AI 打造可自訂的多模態安全防護

回顧過去兩年，NVIDIA 的內容安全技術棧已從一個專注於英文的分類器，發展為一系列專業模型，逐步擴展至新的模態、語言與推論模式。2026 年 3 月推出的 Nemotron 3 Content Safety 首次在單一 4B 參數模型中整合多模態與多語言能力。今日我們發布 Nemotron 3.5 Content Safety，補齊最後一塊拼圖：一個統一處理多模態輸入的單一模型。

10 分鐘前閱讀分析

IT之家生成式AI

全球最強開源生圖 AI 模型：Ideogram 4.0 登場

Ideogram 於6月3日正式發表4.0版本，這是一款採用開放權重架構的文字轉圖片生成模型，官方宣稱其為「全球最佳開源生圖AI模型」。開發人員與研究人員可下載模型權重進行本地部署與二次開發，此舉有望進一步拉高開源模型的品質天花板。

5 小時前閱讀分析

雷峰網生成式AI

全球首個！材科源圖發佈有機高分子應用智能體

在人工智能重塑科研範式的科技浪潮中，因體系複雜、配方變量多，長期面臨高度依賴專家經驗、試錯成本高、知識難以沉澱複用等行業瓶頸，研發效率提升亟待突破。近日，據雷峰網瞭解，蘇州材科源圖（MatSource)正式發佈全球首個有機高分子材料研發應用智能體（Organic Polymer Agent）。該智能體依託自主構建的通用材料科學智能體框架（Materials Agent Framework），面向高分子材料研發場景打造專家級人工智能系統，推動“人工驅動”向“人工智能協同驅動”加速躍遷，為高新材料的高效自主研發提供了關鍵的技術支撐。01 面向複雜研發場景，構建高分子材料研發“智能中樞”作為材科源圖（MatSource) 材料科學智能體體系的重要組成部分，有機高分子應用智能體聚焦高分子材料研發中的關鍵痛點，融合材料知識圖譜、多模態數據理解、大模型推理與領域機理模型能力，構建覆蓋“設計-預測-優化-決策”的全流程智能研發體系。依託這一技術架構，系統可實現高分子分子結構設計與性能預測、配方體系智能生成與多目標優化、工藝參數推薦與實驗路徑規劃，以及文獻知識解析、研發知識沉澱等核心功能，推動專家經驗向數字化能力轉化。通過“知識+模型+工具”的深度協同，顯著提升研發效率與決策質量，為行業由傳統“經驗驅動”向“智能驅動”轉型提供新的技術路徑。02 率先落地光刻膠，完成產業級驗證作為有機高分子材料中技術壁壘最高、研發難度最大的典型代表，光刻膠成為該智能體的首個驗證場景。目前，系統已完成在ArF光刻膠研發場景中的實測驗證，實現從樹脂設計、配方篩選到性能預測的全流程支持，並完成關鍵指標驗證，證明瞭其在複雜有機高分子體系中的工程化能力與應用價值。這意味著，材科源圖（MatSource)不僅驗證了“AI+高分子材料”的技術可行性，也打通了從實驗室研發到產業應用的關鍵路徑。03 從ArF到EUV，持續拓

5 小時前閱讀分析

雷峰網生成式AI

不卷價格和參數，中國汽車如何賣到5000萬輛？

2026年，國內新能源汽車滲透率突破60%，中國汽車品牌的售價提升到80萬元。中國乘聯會秘書長崔東樹說，國產車未來要達到5000萬輛銷售規模，在全球市場中，佔比超過50%。中國汽車越過規模大關，但高速發展之下，行業參數內卷、體驗同質化、盈利承壓等痛點日益凸顯。第四屆未來汽車先行者大會上，奇瑞副總經理王琅直言，行業進入新的“無人區”，不能再卷參數了。跳出價格與參數之外，國產車如何尋找下一個增長點？01元戎啟行周光：智駕幾十公里接管一次和1000公里接管一次，是兩個物種最近幾年，智駕行業的技術重心從端到端、VLA向著大模型、基座模型和物理AI快速迭代。元戎啟行CEO周光分享了他對物理AI基座模型的思考。他認為，過去5年，智駕行業走的是小模型路線，已經到了能力的上限，投入越來越多，提升越來越慢。這個現象可以用“蹺蹺板效應”來形容：在小模型系統裡，當一個版本解決了上海、武漢等城市的問題，可能就會在深圳、廣州等地效果變差，引入新問題。版本之間因此要反反覆覆地修改。周光說，這種蹺蹺板效應在行業中非常普遍，這也是用戶難以長期信任這個系統的原因。2026年，行業認知進入到大模型階段。周光解釋，大模型並不是一個更大的小模型，而是有一整套技術邏輯，在技術棧、網絡結構、訓練方式和模式上都有變化。他舉了一個例子，來說明大模型和小模型的認知區別。假設一條狗被染上斑馬的條紋，小模型會識別為一隻斑馬；但大模型會作出這是一隻狗的判斷。“小模型擅長條件反射、局部特徵相應，大模型擅長高級認知”，周光總結。自動駕駛從一開始的被激活，城區安全接管，再到更高的認知理解，做到像人一樣的整體判斷和泛化能力，需要從執行系統升級到認知系統。周光判斷，今年年底到明年初，行業裡會迎來從小模型到大模型、基座模型的轉換浪潮。技術陡峭升級，大模型成為智駕發展的下一個技術範式。他透露，元戎啟行很早就判斷要全面擁抱大模型和多模態，202

7 小時前閱讀分析

雷峰網生成式AI

面壁智能「開源周」：一場定義端側 AI 終局的系統性「亮劍」

一場罕見的「技術組曲」。作者丨馬曉寧編輯丨林覺民難得能遇到一次大模型開源周。5 月 25 日至 29 日，面壁智能聯合 OpenBMB 開源社區，以每日發佈一項關鍵技術成果的節奏，舉辦了一場「端側大模型開源周」。這在中國乃至全球的大模型公司中，都是一次極為罕見的集體「亮劍」。從適配國產昇騰、未來有望將 600 億參數大模型裝進手機的 1.58-bit 低比特訓練大模型 BitCPM-CANN，到性能超越兩倍參數模型、全球同級最優的 MiniCPM5-1B；從 AI 親手編寫、在 H100 上比英偉達自家大模型訓練框架 Megatron 更快的 ForgeTrain，到重構交互範式的智能體操作系統 PilotDeck；最後，再到揭示端側模型高效智能源頭的核心數據集 UltraData 系列……這五項成果並非孤立的「技術煙花」，而是一套環環相扣、邏輯嚴密的「技術組曲」。它們共同指向一個清晰的行業事實：端側大模型的終局之戰，比拼的不是某個單點技術的拔群，而是覆蓋數據、算法、框架、應用的全鏈路系統工程的創新總和。面壁開源周，更迫使我們重新思考：在通往 AGI 的道路上，開源的真正價值是什麼？而端側，又將在其中扮演怎樣的角色？01為何開源周如此之少翻開過去三年的歷史，面壁之外，也僅有以「效率美學」著稱的 DeepSeek 在 2024 年（6月24日-28日）進行過類似的開源周活動。此外，雖然有些公司有過一週開源三款模型的記錄，但是還未曾冠以開源周的名義。做“開源周”，通常意味著一個機構需要在短時間內（一週）集中釋放大量、系統性的技術成果。這不僅僅是數量的堆砌，更關鍵的是質量的深度和規劃的體系性。無論是DeepSeek，還是面壁的開源周案例，我們可以這樣理解：刻意將發佈壓縮在5-7天內，每天甚至半天就有新項目放出。這需要背後有充足的項目儲備和成熟的發佈節奏規劃。這次面壁的開源，

8 小時前閱讀分析

相關文章

專家預測年底才到，Claude Mythos今天就跑出3小時6分

Nemotron 3.5 內容安全：為全球企業 AI 打造可自訂的多模態安全防護

全球最強開源生圖 AI 模型：Ideogram 4.0 登場

全球首個！材科源圖發佈有機高分子應用智能體

不卷價格和參數，中國汽車如何賣到5000萬輛？

面壁智能「開源周」：一場定義端側 AI 終局的系統性「亮劍」