小鵬新成立智能擬態(tài)部,劍指機(jī)器人多模態(tài)
近日,《科創(chuàng)板日報》消息傳來,小鵬機(jī)器人中心有大動作,新成立智能擬態(tài)部,將研究重點放在機(jī)器人多模態(tài)領(lǐng)域。
智能擬態(tài)部負(fù)責(zé)人葛藝瀟履歷亮眼。他本科畢業(yè)于華中科技大學(xué)自動化學(xué)院,后在香港中文大學(xué)MMLab攻讀博士學(xué)位,在國際頂級會議發(fā)表多篇論文。在騰訊工作時,他28歲就晉升為騰訊T12技術(shù)專家,還在2023年和2024年連續(xù)獲得騰訊技術(shù)突破獎。
目前,包括葛藝瀟在內(nèi),智能擬態(tài)部僅有3名成員。不過,該部門已開啟社招、校招和實習(xí)招聘,招聘“研究科學(xué)家(多模態(tài)方向)”,從職位描述中能看出小鵬對這個新部門的高期望。
那么,多模態(tài)技術(shù)究竟是什么?為何小鵬要聚焦于此?人類靠“多模態(tài)”感知世界,能綜合處理多種信息來決策。而傳統(tǒng)機(jī)器人大多是“單模態(tài)”,信息處理方式單一。比如掃地機(jī)器人,僅靠激光雷達(dá)識別家具位置,面對復(fù)雜情況就可能“撞衫”。多模態(tài)技術(shù)能讓機(jī)器人像人類一樣,同時處理視覺、聽覺、觸覺等多種信息,提升其在復(fù)雜環(huán)境中的作業(yè)能力。
在機(jī)器人技術(shù)發(fā)展中,傳統(tǒng)機(jī)器人在感知與交互上存在短板。具身智能原生多模態(tài)大模型若取得進(jìn)展,家用機(jī)器人就能完成復(fù)雜任務(wù),工業(yè)場景中機(jī)器人也能更高效精準(zhǔn)地組裝產(chǎn)品。世界模型則能讓機(jī)器人深度理解世界規(guī)律,不再依賴預(yù)設(shè)程序。空間智能可提升機(jī)器人在空間環(huán)境中的感知與操作能力。
此前,小鵬汽車董事長何小鵬曾在今年5月的財報電話會議上披露,將在第五代機(jī)器人上部署圖靈芯片,大幅提高機(jī)器人端側(cè)算力。并且,小鵬機(jī)器人的模型將跨越行業(yè)普遍使用的技術(shù)路線,直接同源共用小鵬物理世界基座模型的VLA架構(gòu),復(fù)用云端AI基礎(chǔ)設(shè)施,提高機(jī)器人智能上限。
小鵬汽車在人形機(jī)器人產(chǎn)業(yè)已深耕5年,計劃未來20年投入500億元甚至上千億元。2026年,小鵬汽車還計劃量產(chǎn)面向工業(yè)場景的L3級人形機(jī)器人。此次成立智能擬態(tài)部,是小鵬在機(jī)器人領(lǐng)域長期戰(zhàn)略布局的關(guān)鍵一步,旨在通過多模態(tài)技術(shù)提升機(jī)器人智能水平,拓展其在智能出行、家庭服務(wù)和工業(yè)生產(chǎn)等多領(lǐng)域的應(yīng)用場景。
最新問答

