2026-03-10 拓墣產業研究院

人型機器人模型發展剖析：從模型創新轉向數據累積

焦點報告 AI關鍵軟硬體人機科技

意見反映字體大小小中大

摘要

VLA(Vision-Language-Action，視覺－語言－動作)模型為奠定人型機器人的基礎架構，但面臨生態碎片化與數據稀缺挑戰。在模型架構方面，開源與硬體抽象層將可推動跨平台部署，而觸覺感測與多模態時序對齊為多模態融合之關鍵；在數據方面，機器人即服務(RaaS)租賃模式將成為加速規模化與多樣數據收集的重要商業模式，而世界模型提供低成本數據補充，共同解決物理互動數據稀缺困境。

一. VLA模型生態與數據為現階段人型機器人發展瓶頸
二. 模型發展重心逐漸轉向數據累積與場景多樣性
三. 拓墣觀點

圖一　VLA模型發展史
圖二　Transformer+Tokenization架構說明
圖三　觸覺相關數據對人型機器人之影響

表一　2026年2月RoboChallenge Table30具身智能評測結果
表二　2026年機器人VLA模型廠商更新動態舉要

會員專屬

您好，該資料屬會員權益方可瀏覽，您需成為會員且購買此產業項目權限才可觀看，詳細說明如下：

拓墣產業研究院之「產業資料庫」為付費的會員服務，若您尚未具備會員身份，歡迎您申請加入或是與我們的客服聯絡瞭解。
若您所屬公司機關已具有拓墣會員身份，並且設定予貴公司人員線上申請，請先行移至「申請會員帳號」填寫申請資料後送出，我們會儘快為您審核辦理。若未開放線上申請，請您詢問貴公司的承辦連絡人處理，謝謝。
由於貴公司無採購此產業項目，因此您將無法瀏覽此篇文章，欲查詢貴公司所購買的產業項目明細，請至「會員權益」查詢，謝謝。