分類頻道

研究與前沿

共 58 篇文章，依最新發布時間排序。

生成式AI 模型更新 AI Agent AI工具與產品產業與商業研究與前沿 AI應用場景電腦視覺機器人技術自然語言處理自動駕駛醫療AI 金融AI AI硬體 AI倫理與安全其他AI

基於任務種子的合成問答生成用於Nemotron預訓練

在大型語言模型的開發中，問題不再只是模型看到多少數據，還在於數據是否包含足夠的結構化學習信號。一般網絡、程式碼、數學、多語言和領域數據提供了廣泛基礎，而基於任務種子的合成問答（SDG）通過添加緊湊、任務結構化的範例來補充它們，這些範例具有明確的資訊需求、受限的回應空間，以及將證據與答案聯繫起來的解釋。在Nemotron-3 Nano模型的1000億詞元延續實驗中，基於任務種子的SDG使MMLU-Pro提升1.8分，平均程式碼能力提升1.9分，常識推理能力也有所提升。

6 小時前閱讀分析

量子位研究與前沿

LeCun 10億押注的方向，全球領先視覺大模型團隊早已佈局

LeCun投入10億美元押注的隱空間世界模型領域，雖然技術難度極高，但全球領先的視覺大模型團隊早已展開相關佈局。這項技術被視為未來AI發展的關鍵方向，團隊決心克服挑戰持續推進。

6 小時前閱讀分析

量子位研究與前沿

剛剛，李飛飛親自下場定義世界模型

李飛飛近日明確重新定義「世界模型」，強調渲染、模擬與規劃三大功能應無縫整合，而非各自獨立發展。她認為真正的世界模型必須讓AI能同時感知環境、推演動態並制定策略，此觀點可能推動機器人與自駕車等領域的突破。相關研究論文或開源框架預料即將發布，將影響未來AI研發方向。

9 小時前閱讀分析

雷峰網研究與前沿

慕尼黑工大Johannes Betz 教授：時速300公里的自動駕駛超車｜ ICRA 2026

大多數AI賽車研究停留在仿真裡，這輛車是真的在賽道上撞過。作者丨陳淑瑜編輯丨岑峰 2026年6月2日，在ICRA 2026大會上，慕尼黑工業大學（TUM）自動駕駛實驗室負責人Johannes Betz發表了題為“Autonomous Vehicles & Navigation ”的演講，系統回顧了過去八、九年其團隊在自動駕駛賽車領域的研究歷程與核心洞察。Johannes Betz開篇即拋出一個尖銳的問題：為什麼要研究自動駕駛賽車？他的回答直指機器人學的一個根本困境：賽車天然集成了多變環境、高速交互與極小容錯空間三個極致要素，構成了完美的研究沙盒。在此基礎上，他的團隊選擇了一條與主流“端到端強化學習”截然不同的技術路徑：一套經典的生產級感知-規劃-控制管線，輔以“一個博士生一個算法”的管理哲學，確保每個模塊擁有完全的技術所有權和極致的工程深度。在軟件架構層面，Betz提煉出四條硬核教訓：第一，多傳感器融合（GPS+激光雷達+毫米波雷達）是高速定位的基石，尤其是在GPS信號拒止的真實戰場環境中；第二，三維狀態估計是捕捉漂移、側偏角等極限動力學的前提，缺此則一切免談；第三，全局-局部雙層規劃架構，結合博弈論實現多車交互預測，是賽車能夠自主決策超車時機的關鍵——他展示了一段在阿布扎比亞斯碼頭賽道上完成的並排超車視頻，全程自動駕駛，十次中有九次成功；第四，當經典管線跑通之後，真正的挑戰來到了“如何比人類更快”。為此，Betz 團隊耗時三年，逆向工程了人類賽車手的行為模式，開發出名為APEX的“人類啟發的主動駕駛智能”系統。APEX的核心邏輯是：人類通過視覺、觸覺、聽覺感知極限，再憑藉記憶持續調整軌跡來逼近極限，而非死守一條固定的最優基線。這套系統在與梅賽德斯-AMG的合作測試中，以2.6秒的優勢擊敗了奔馳測試車手，又以1秒優勢戰勝了前DTM賽車手本·施奈德。然而在面對目前F1車

10 小時前閱讀分析

雷峰網研究與前沿

港中深王方鑫團隊：3D 重建的「玻璃杯難題」，終於被擺上檯面丨CVPR 2026

3DReflecNet：一個專為玻璃、金屬與陶瓷等材料建立的大規模數據集。作者丨樊天驕、鄭佳美編輯丨鄭佳美想為手上的玻璃杯生成 3D 模型，需要幾步？拍照、掃描、建模......聽上去似乎很簡單，可如果你真的動手試試，得到的往往是佈滿孔洞、邊緣扭曲的殘缺結果。這就是當前 3D 重建技術的瓶頸：無論是爆火的 3D 高斯濺射（3D Gaussian Splatting, 3DGS）、神經輻射場（Neural Radiance Fields, NeRF），還是傳統的多視圖立體匹配方法，都只對不反光的漫反射材質且擁有足夠清晰的紋理特徵的物體有效。而對於那些具有反射、透明和低紋理表面特性的材料，現有技術可以說是束手無策，比如金屬、玻璃和陶瓷。金屬的反光特性會讓同一物體在不同角度、不同光照下呈現截然不同的特徵，玻璃的折射徹底會扭曲光線傳播路徑，光滑的陶瓷則缺乏可供算法匹配的特徵點。這就造成了以下現象：服務機器人想要拿起一個玻璃碗，卻常常因為識別不到物體輪廓而失手；工業質檢系統試圖掃描拋光後的不鏽鋼零件時，得到的 3D 模型卻總是扭曲且失真的。算法，就像是活在一個物體都是漫反射的世界裡，而真實物理世界遠遠比這複雜得多。在這樣的行業背景下，香港中文大學（深圳）王方鑫教授團隊聯合首都師範大學、南加州大學的研究者提出了《3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects》，構建了專門針對反射、透明、低紋理三類高難度物體的大規模混合 3D 重建數據集。這項研究打造了一個包含 12 萬+合成實例、1000+ 真實物體、總規模超 22 TB 的綜合數據集，並建立了涵蓋圖像匹配、運動恢復結構、新視角合成、反射去除和重光照五大核心任務

14 小時前閱讀分析

36氪研究與前沿

世界模型，擠滿了00後

這篇消息聚焦「世界模型，擠滿了00後」。原始導語提到：資本集體“叛變” 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前閱讀分析

36氪研究與前沿

AI 教父下場創業：硅谷開始押注“下一代 AI 範式”

這篇消息聚焦「AI 教父下場創業：硅谷開始押注“下一代 AI 範式”」。原始導語提到：LeCun創AMI，另闢蹊徑研發世界模型探索AGI 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前閱讀分析

鈦媒體研究與前沿

推翻主流治幻覺思路：元認知，才是大模型破幻覺的全新解法

這篇消息聚焦「推翻主流治幻覺思路：元認知，才是大模型破幻覺的全新解法」。原始導語提到：ICML 2026 論文：依託元認知重構大模型反幻覺技術框架。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前閱讀分析

雷峰網研究與前沿

獨家實拍｜蘇昊旗下機器人全球首次亮相，蘇度科技驚豔 ICRA 2026

無真機數據訓練的機器人，Zero-shot成功率接近100%。作者丨向欣編輯丨馬曉寧 6月1日，ICRA 2026在奧地利維也納開幕。展會現場，具身智能明星公司蘇度科技首次向全球公開展示了其機器人。AI科技評論在現場看到，機器人能夠準確抓取不同材質和形態的物體，包括海綿、塑料瓶、紙盒、螺絲刀、線束、參會證等，所有物品均由人類隨機擺放。機器人外觀與此前蘇度科技公開視頻中的版本保持一致，採用雙臂設計，機械臂擁有7個自由度。現場工作人員介紹，蘇度科技自研了視覺感知系統，夾爪上集成了多枚攝像頭。現場相關人員透露，蘇度科技正在構建多樣化的原子技能體系，希望機器人能夠具備更強的泛化抓取和操作能力。現階段公司主要面向開發者開放軟件能力，由合作伙伴基於其系統開發不同場景應用。蘇度科技此前已經憑藉一段抓取Demo在業內獲得廣泛關注。今年4月，公司首次公開全棧自研機器人系統#Sudo R1。視頻中，機器人在60分鐘內連續抓取了100多個從未見過的物體，包括透明、反光、金屬、柔性和不規則形狀等高難度目標物體。其中的技術亮點在於，模型訓練過程中沒有使用任何真機數據，機器人能力完全來自仿真訓練，卻能夠在真實環境中完成任務，並取得接近100%的Zero-shot成功率。仿真訓練也是蘇度科技最鮮明的技術標籤。▎首席技術顧問蘇昊：ImageNet核心貢獻者、3D視覺奠基者之一蘇度科技首席技術顧問蘇昊是全球具身智能與3D視覺領域最具影響力的華人學者之一，同時是ImageNet核心貢獻者和3D視覺領域奠基者。公開資料顯示，其論文累計被引用約15萬次，在具身智能領域華人學者中排名第一。蘇昊學術履歷頗為紮實。他本科畢業於北京航空航天大學，後赴斯坦福大學攻讀計算機科學博士。在博士期間，他主導創建了ShapeNet數據集和PointNet網絡，這兩項工作奠定了三維視覺領域的基礎。此後，蘇昊進入加州大學聖地亞哥分

1 天前閱讀分析

36氪研究與前沿

圖靈獎得主Sutton新作：AI的下一步，是走向“生成認知”

這篇消息聚焦「圖靈獎得主Sutton新作：AI的下一步，是走向“生成認知”」。原始導語提到：世界本身就是它最好的模型從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

2 天前閱讀分析

36氪研究與前沿

牛津、英偉達等提出記憶壓縮新範式：訓練時讓模型學會斷舍離

這篇消息聚焦「牛津、英偉達等提出記憶壓縮新範式：訓練時讓模型學會斷舍離」。原始導語提到：與其事後彌補，不如訓練時就讓模型主動學會「壓縮友好」的記憶方式。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

2 天前閱讀分析

IT之家研究與前沿

圖靈獎得主查德 · 薩頓稱普通生成式 AI 難以完成真正科學發現

科技媒體 The Decoder 昨日（6 月 1 日）發佈博文，報道稱圖靈獎得主理查德 · 薩頓（Richard Sutton）認為普通生成式 AI 缺少自我評估與持續篩選能力，難以完成真正科學發現。

2 天前閱讀分析

AIBase研究與前沿

英偉達聯合清華推出 Gamma-World，打破多智能體虛擬仿真天花板

英偉達聯合清華、多倫多大學及Vector Institute發佈Gamma-World多智能體世界模型，突破傳統單智能體假設瓶頸。該模型能處理多個玩家在虛擬世界中同時操作、互相觀察的複雜場景，核心難點在於同步維護時間與跨視角信息，實現視頻世界模型從單人向多人協作的底層變革。

2 天前閱讀分析

36氪研究與前沿

黃仁勳發佈Alpamayo 2 Super：自動駕駛黑箱終於被打開了

這篇消息聚焦「黃仁勳發佈Alpamayo 2 Super：自動駕駛黑箱終於被打開了」。原始導語提到：320億參數，換一個“透明”的駕駛決策。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

2 天前閱讀分析

36氪研究與前沿

只需幾個抽象符號替代思維鏈，就能將推理成本壓縮11倍

這篇消息聚焦「只需幾個抽象符號替代思維鏈，就能將推理成本壓縮11倍」。原始導語提到：A、B、C、D、E、F…… 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

3 天前閱讀分析

IT之家研究與前沿

讓機器人看懂世界：英偉達推出全球首款全開源全模態物理 AI 大模型 Cosmos 3

英偉達正式推出面向物理 AI 的開放世界基礎大模型 Cosmos 3，融合視覺、推理、生成與動作預測。它採用混合 Transformer 架構，能大幅縮短 AI 訓練週期，助力開發者在機器人、自動駕駛等領域實現突破。#英偉達 Cosmos3# #物理人工智能#

3 天前閱讀分析

雷峰網研究與前沿

星海圖新一代具身基礎模型G0.5發佈，全面提升零樣本泛化能力，讓機器人邊思考邊行動

過去，機器人聽到“幫我把毛巾放進洗手池”——它只會機械地執行一串預設動作。現在，我們讓G0.5做到了：先想——毛巾在哪？洗手池在哪？應該先拿起毛巾，再移動過去，最後放下。邊思考，邊行動。這一能力依託於我們最新的 VLA（視覺-語言-行動）模型架構設計：讓同一個模型、同一套權重，同時完成推理與行動，讓機器人擁有“行動中的思考能力”。言出法隨：零樣本泛化至新物體、新環境、新指令G0.5 在 R1 Lite 機器人上，零樣本（未經任何該場景的微調），僅憑自然語言指令直接驅動機器人完成操作任務。模型從未見過當前的環境佈局、物體類別和指令組合，卻能實時理解指令意圖、分解動作並輸出流暢的雙臂控制。這正是 G0.5 “言出法隨”的開箱即用能力——一個模型，一句話，直接幹活。從“記住任務”到“學會操作”過去，機器人學習一項新任務通常意味著：重新採集數據、重新微調模型、重新適配場景。它們可以出色地完成被訓練過的任務，卻很難泛化到新的物體、新的環境和新的指令。我們通過大規模、多任務預訓練，讓 G0.5 形成了可遷移、可組合的操作智能。抓取、放置、推拉、開合、移動等原子動作，不再是單個任務中的固定片段，而是沉澱為模型可以複用的能力單元。在面對新的場景、空間佈局和從未見過的物體時，僅憑自然語言指令，G0.5 就能直接執行操作，機器人開始 “邊思考邊行動”（Think While Acting）。三大核心能力：讓具身基礎模型學會“邊想邊幹”1. 統一異構動作編解碼器：讓一種“動作語言”覆蓋所有機器人不同機器人的形態、自由度、控制頻率千差萬別——雙臂人形、移動底盤、單臂工業機器人，每一種都有各自的動作維度。過去的做法，要麼每種機器人單獨搞一套（如 FAST 用固定的 DCT 流水線為每種 embodiment 各自離散化），要麼把所有自由度拍平成一個長向量再做量化。前者無法跨本體共享知識，後者會讓 t

3 天前閱讀分析

36氪研究與前沿

內存暴降50倍且精度無損，MIT提出注意力匹配，能終結大模型顯存危機嗎？

麻省理工學院提出的「注意力匹配」技術，能讓大型語言模型的記憶體需求大幅降低50倍，且不影響運算精度。這項突破有望解決大模型訓練與部署時的顯存瓶頸，甚至讓單一機器得以處理全球規模的知識數據。

3 天前閱讀分析

雷峰網研究與前沿

ICRA 2026｜狹窄空間中機器人主動感知與操作

原文作者：用戶“胖頭魚在此”原文鏈接：https://www.xiaohongshu.com我們的論文被 ICRA 2026 錄取了！論文編號是 Paper TuI1I.294。這篇工作想回答一個很實際的問題：如果機器人要在狹窄、雜亂、看不清的空間裡抓東西，它應該怎麼“邊看邊動”，而不是盲目伸手？在很多真實場景裡，機器人並不是一開始就擁有完整地圖。比如目標物體可能被障礙物擋住，機械臂周圍也可能有箱子、牆壁、櫃子等限制。機器人既看不清目標，又不能隨便亂動，因為一不小心就會撞到環境，或者擺出一個根本抓不到東西的姿態。所以，狹窄空間操作的難點不只是“怎麼抓”，而是：機器人要先安全地探索環境，找到目標，再生成真正可執行的抓取動作。我們提出了 COMPASS，一個面向狹窄空間操作的主動感知與操作規劃框架。它主要包含三步：第一步，機器人先做 Near-Field Awareness Scan，用腕部相機小心地掃描自己附近的空間，先搞清楚“身邊哪裡不能碰”。第二步，機器人使用 Manipulation-Utility Exploration RRT主動選擇下一個觀察視角。它不是隻看哪裡信息最多，還會同時考慮機械臂是否容易運動、姿態是否接近奇異、路徑是否平滑、後續是否有利於抓取。第三步，當目標被發現後，系統會生成滿足障礙物約束和運動學約束的抓取姿態，而不是隻選擇一個幾何上看起來不錯、但機器人實際伸不過去的抓取。我們還構建了一個狹窄空間操作 benchmark，從簡單遮擋、嚴重遮擋，到強運動學約束，再到二者耦合的複雜場景，系統評估機器人在“看不清”和“伸不開手”同時存在時的表現。實驗結果顯示，相比只考慮信息增益或傳統探索策略的方法，COMPASS 在仿真中顯著提升了整體操作成功率；在真實機器人實驗中，也能在未知、遮擋、狹窄的環境裡主動探索、找到目標，並完成約束下的抓取。未

3 天前閱讀分析

雷峰網研究與前沿

速賣通為品牌出海搭建百大網紅直播矩陣，618正式開播

速賣通AliExpress品牌出海計劃再升級！今年618期間，阿里旗下跨境電商平臺速賣通開啟大規模直播帶貨，組建百大海外網紅矩陣，為超60箇中國品牌進行100多場直播，覆蓋全球14個國家。這是速賣通品牌出海計劃的又一迭代升級，繼續從單一“賣貨”渠道向“品牌成長基礎設施”躍遷。 6月1日是速賣通海外618大促的第一天，記者在杭州阿里總部看到，兩位來自西班牙和日本的網紅，正在透過鏡頭向當地消費者介紹速賣通Brand+裡的中國品牌。鏡頭的另一端，是Youtube上兩位網紅的粉絲們，彈幕和評論蹭蹭跳出，諮詢商品的型號、折扣、發貨時間。據速賣通介紹，這樣的直播今年618期間將有至少100場，除了今天在杭州開播的2場，其餘均在海外當地開播，覆蓋西班牙、法國、意大利、波蘭、德國、美國、巴西等14個國家。參與直播的中國品牌數量達到了60個，如小米、Gamesir（蓋世小雞）、榮耀、綠聯等，這些品牌均已加入速賣通Brand+品牌出海計劃。（）直播矩陣將成為品牌出海的“生態基建” 速賣通國家業務負責人英朋介紹說，當前中國品牌出海面臨的核心痛點是“缺乏認知和信任”。為此，速賣通將海外網紅直播提升至核心戰略高度：通過內容種草深度連接中國供應鏈與世界消費者，助力中國品牌在海外完成從單純“賣貨”到“建立品牌資產”的能力跨越。一方面，速賣通順應海外Z世代依賴KOL決策的趨勢，利用本地網紅進行“文化轉譯”，打破中國製造“低價低質”的刻板印象；另一方面通過“反向溯源直播”等創新玩法，邀請海外網紅深入中國產業帶，將供應鏈轉化為可視化的品牌故事。這一策略已在前期測試中得到驗證。去年618，速賣通邀請美國千萬粉絲級網紅深入泡泡瑪特北京樂園進行“反向帶貨”，吸引全球24萬人觀看，Labubu等熱門IP瞬間售罄。經過一年的鏈路打磨，今年速賣通正式將這一能力向品牌全面開放。天貓行車記錄儀類目Top2品牌盯

3 天前閱讀分析

研究與前沿

基於任務種子的合成問答生成用於Nemotron預訓練

LeCun 10億押注的方向，全球領先視覺大模型團隊早已佈局

剛剛，李飛飛親自下場定義世界模型

慕尼黑工大Johannes Betz 教授：時速300公里的自動駕駛超車 ｜ ICRA 2026

港中深王方鑫團隊：3D 重建的「玻璃杯難題」，終於被擺上檯面丨CVPR 2026

世界模型，擠滿了00後

AI 教父下場創業：硅谷開始押注“下一代 AI 範式”

推翻主流治幻覺思路：元認知，才是大模型破幻覺的全新解法

獨家實拍｜蘇昊旗下機器人全球首次亮相，蘇度科技驚豔 ICRA 2026

圖靈獎得主Sutton新作：AI的下一步，是走向“生成認知”

牛津、英偉達等提出記憶壓縮新範式：訓練時讓模型學會斷舍離

圖靈獎得主查德 · 薩頓稱普通生成式 AI 難以完成真正科學發現

英偉達聯合清華推出 Gamma-World，打破多智能體虛擬仿真天花板

黃仁勳發佈Alpamayo 2 Super：自動駕駛黑箱終於被打開了

只需幾個抽象符號替代思維鏈，就能將推理成本壓縮11倍

讓機器人看懂世界：英偉達推出全球首款全開源全模態物理 AI 大模型 Cosmos 3

星海圖新一代具身基礎模型G0.5發佈，全面提升零樣本泛化能力，讓機器人邊思考邊行動

內存暴降50倍且精度無損，MIT提出注意力匹配，能終結大模型顯存危機嗎？

ICRA 2026｜狹窄空間中機器人主動感知與操作

速賣通為品牌出海搭建百大網紅直播矩陣，618正式開播

慕尼黑工大Johannes Betz 教授：時速300公里的自動駕駛超車｜ ICRA 2026