VLA

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機器人或者汽車運動軌跡數(shù)據(jù),進一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機器人或者汽車控制的文本編碼動作。

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機器人或者汽車運動軌跡數(shù)據(jù),進一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機器人或者汽車控制的文本編碼動作。收起

查看更多
  • 理想智駕的VLA模型及其結(jié)構(gòu)
    我們之前文章《2025年,自動駕駛即將開“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》分享過VLA,現(xiàn)在,不少公司已經(jīng)宣稱會在2025年下半年都會推出此類模型結(jié)構(gòu)。所以,本文將通過理想相關(guān)信息來拆解分享理想智駕VLA算法。理想VLA模型架構(gòu)的四大核心模塊:
    563
    04/25 14:33
    理想智駕的VLA模型及其結(jié)構(gòu)
  • 特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進化
    【觀點:全局端到端除了太消耗運算和存儲資源外,還很難添加輔助模塊,如應(yīng)對交通規(guī)則的地圖模塊,特斯拉就是因此幾乎完全無法適應(yīng)中國的交通規(guī)則。模塊化端到端將是主流,至少在違反交通規(guī)則處罰力度和廣度都很強的中國如此,某種意義上講還是快慢雙系統(tǒng),快系統(tǒng)是diffusion planner或policy,慢系統(tǒng)是LLM或VLM?!?/div>
    特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進化
  • VLA,是不是自動駕駛的下一站?
    中國農(nóng)歷新年結(jié)束沒多久,馬斯克就給中國的特斯拉車主送上一份大禮——2月26日,在毫無征兆的情況下特斯拉向中國區(qū)購買了FSD的HW4.0車主開啟了功能推送。此前一度傳言FSD因為數(shù)據(jù)問題入華時間將推遲,而且這次推送的是和美國相同的V13版本,對于它在中國的表現(xiàn)大家非常好奇,隨后各大媒體和大V都對FSD進行了詳細(xì)的測試。
    VLA,是不是自動駕駛的下一站?
  • 智駕平權(quán)“最大公約數(shù)”地平線:2024年營收23.84億元創(chuàng)新高,同比大增53.6%
    地平線機器人-W(09660.HK,以下簡稱“地平線”)發(fā)布2024年業(yè)績公告。截至2024年12月31日止,地平線全年營收23.84億元,同比增長53.6%;毛利潤18.41億元,同比增長68.3%;現(xiàn)金及現(xiàn)金等價物儲備同比增加,流動性維持充足。公司營收與毛利潤表現(xiàn)亮眼,增長勢頭強勁。 量產(chǎn)規(guī)模加速擴大,穩(wěn)居智駕市場領(lǐng)導(dǎo)地位 地平線成立于2015年,是市場領(lǐng)先的乘用車高級輔助駕駛(ADAS)和高
    智駕平權(quán)“最大公約數(shù)”地平線:2024年營收23.84億元創(chuàng)新高,同比大增53.6%
  • Figure AI發(fā)布VLA模型Helix,人形機器人商業(yè)化元年正在來臨
    北美時間2月20日,人形機器人公司Figure AI發(fā)布新型通用人形機器人VLA模型Helix。本次Figure發(fā)布的視頻當(dāng)中能看到,有兩臺搭載了Helix模型的Figure機器人共同協(xié)作,完成了拾取任意物品并分類的任務(wù)操作。VLA模型是指視覺(Vision)-語言(Language)-動作(Action)模型,機器人可以將感知、語言等多模態(tài)的信息和學(xué)習(xí)到的控制能力結(jié)合,從而輸出執(zhí)行命令的動作。
    Figure AI發(fā)布VLA模型Helix,人形機器人商業(yè)化元年正在來臨
  • 地平線SuperDrive首發(fā)三大黑科技,決勝智能化競爭下半場
    “Beyond the Horizon 地平線智駕科技暢想日”在上海舉辦,回顧地平線以軟硬結(jié)合技術(shù)實力取得的量產(chǎn)創(chuàng)新成果,展望2025高階智駕爆發(fā)之年。同時,“SuperDrive智駕百人團體驗活動”在上海靜安區(qū)繁華路段開展,首發(fā)三大智駕黑科技,打造擬人高效、“10分上手”的智駕體驗新標(biāo)桿。 決勝智駕競爭賽點,以實力“向上捅破天” 在暢想日上,地平線創(chuàng)始人兼CEO余凱博士帶來了一場風(fēng)趣而深刻的“智
    地平線SuperDrive首發(fā)三大黑科技,決勝智能化競爭下半場
  • 開炒VLA,“端到端”過氣了?
    端到端2.0時代,會“嗖”地一下來了?2024年,智駕領(lǐng)域最熱的詞,就是“端到端”。甚至,到了不聊端到端都沒法出門的程度。不過,在這個光速迭代的智能電動化時代,“端到端”會被迭代替掉,也是可想而知的。于是,VLM、VLA、世界模型……概念涌現(xiàn),被譽為“端到端2.0”的VLA(Vision-Language-Action Model,視覺-語言-動作模型)閃亮登場。
    開炒VLA,“端到端”過氣了?
  • 2025年,自動駕駛即將開“卷”的端到端大模型2.0 - VLA
    太卷了,智能駕駛在國內(nèi)的落地發(fā)展太迅速了,從體驗功能端,大家開城大戰(zhàn)打完了之后就進入點到點的落地戰(zhàn),點到點弄完了之后肯定Robotaxi大戰(zhàn);而在硬核的軟件技術(shù)端,端到端大模型戰(zhàn)在華為這個月宣布急攻端到端大模型的信息下,已經(jīng)算是進入焦灼狀態(tài)。
    2025年,自動駕駛即將開“卷”的端到端大模型2.0 - VLA

正在努力加載...