http://m.sharifulalam.com 2025-06-24 09:29 來源:南方財(cái)經(jīng)
6月23日,南方財(cái)經(jīng)記者從帕西尼感知科技(深圳)有限公司(以下簡(jiǎn)稱“帕西尼”)處獲悉,該公司主導(dǎo)建設(shè)的具身智能超級(jí)數(shù)據(jù)工廠(Super EID Factory)正式投入運(yùn)營(yíng)。
作為深圳本土培育的前沿科技企業(yè),本次帕西尼落成的數(shù)據(jù)工廠選址于天津市河西區(qū)空天數(shù)字產(chǎn)業(yè)園,面積近12000平方米,預(yù)計(jì)年產(chǎn)近2億條高維訓(xùn)練數(shù)據(jù)。
帕西尼方面稱,這座超級(jí)數(shù)據(jù)工廠是目前全球范圍規(guī)模最大、數(shù)據(jù)采集體量領(lǐng)先的具身智能數(shù)據(jù)采集與模型訓(xùn)練基地,將為當(dāng)前具身智能產(chǎn)業(yè)面臨的數(shù)據(jù)集稀缺、觸覺模態(tài)數(shù)據(jù)空白、泛化性差等核心困境提供革命性解決方案。
據(jù)悉,這座工廠里構(gòu)建了“15+N”個(gè)全場(chǎng)景矩陣為基礎(chǔ)的千種任務(wù)與百萬道工序,涵蓋汽車制造、3C裝配、家庭、辦公、餐飲、商超、康養(yǎng)、醫(yī)療等全鏈條具身智能應(yīng)用環(huán)境,旨在模擬真實(shí)世界中機(jī)器人可能遇到的各種復(fù)雜場(chǎng)景。
值得一提的是,這并不是第一個(gè)為獲取數(shù)據(jù)而建設(shè)具身智能工廠的案例。此前北京和上海都有類似的具身智能機(jī)器人創(chuàng)新中心負(fù)責(zé)數(shù)據(jù)生產(chǎn)和采集。其中,北京具身智能機(jī)器人創(chuàng)新中心成立于2023年,由優(yōu)必選、京城機(jī)電、小米機(jī)器人、亦莊機(jī)器人等10家行業(yè)領(lǐng)軍企事業(yè)單位出資聯(lián)合組建,號(hào)稱數(shù)據(jù)集將達(dá)百萬級(jí)。
但此次帕西尼參與建設(shè)的數(shù)據(jù)工廠光是數(shù)據(jù)量就奔著上億級(jí)別的量級(jí)而去。而這么大量的數(shù)據(jù)將涉及的第一個(gè)問題就是,數(shù)據(jù)能否通用。
據(jù)了解,為保證數(shù)據(jù)的廣泛適配性,帕西尼在工廠內(nèi)部部署150個(gè)標(biāo)準(zhǔn)化采集單元,每個(gè)標(biāo)準(zhǔn)化數(shù)據(jù)集采集都基于真人手部動(dòng)作姿態(tài)來捕捉,并通過“空間視覺矩陣”進(jìn)行“視覺-觸覺”模態(tài)對(duì)齊,極大地提升了數(shù)據(jù)的通用性。同時(shí),后續(xù)通過體感重定向系統(tǒng)(Soma Redirect),采集而來的數(shù)據(jù)還能向不同型號(hào)、不同設(shè)計(jì)的機(jī)器人輸出,使得數(shù)據(jù)集有效突破模型的跨本體泛化能力瓶頸。
(圖為工程師佩戴帕西尼自研的“多維觸覺數(shù)據(jù)采集設(shè)備PMEC”在采集數(shù)據(jù))
數(shù)據(jù)采集量所面臨的第二個(gè)問題就是成本。帕西尼方面表示,由于無需依賴昂貴的機(jī)器人本體進(jìn)行數(shù)據(jù)采集,帕西尼的解決方案顯著降低了采集成本,使得大規(guī)模、高質(zhì)量的數(shù)據(jù)生產(chǎn)成為可能,為行業(yè)發(fā)展提供了經(jīng)濟(jì)高效的路徑。
當(dāng)通用性和成本得到保障之后,第三個(gè)需要探討的就是數(shù)據(jù)集是否足夠高質(zhì)量。帕西尼方面稱,其獨(dú)創(chuàng)的多模態(tài)神經(jīng)織網(wǎng)技術(shù)(Neural Mesh)實(shí)現(xiàn)了觸覺、視覺、關(guān)節(jié)角度、動(dòng)作軌跡、語(yǔ)音等多維度數(shù)據(jù)的無損采集。這種多模態(tài)數(shù)據(jù)的融合,能夠?yàn)榫呱碇悄苣P吞峁└娴沫h(huán)境信息,使其能夠更精準(zhǔn)地理解任務(wù)、感知世界。
該具身智能超級(jí)數(shù)據(jù)工廠不僅能惠及全行業(yè),還能助力帕西尼多模態(tài)具身智能數(shù)據(jù)集(MotionSharing DB),升級(jí)成為全模態(tài)數(shù)據(jù)集(OmniSharing DB)。
而升級(jí)后的全模態(tài)數(shù)據(jù)集,將進(jìn)一步提升帕西尼自研的 TacFlow Engine大模型,形成共生飛輪,即數(shù)據(jù)作為模型的“感官輸入”驅(qū)動(dòng)其進(jìn)化;模型預(yù)測(cè)能力的缺口又能反向指導(dǎo)數(shù)據(jù)的定向增強(qiáng)采集。
值得注意的是,5日前,帕西尼剛完成A系列的第四輪融資,投資方包括TCL創(chuàng)投、毅達(dá)資本、尚頎資本、基石資本、商湯國(guó)香、中信里昂、湖南財(cái)信產(chǎn)業(yè)基金、鈞犀資本等多家知名機(jī)構(gòu)聯(lián)合投資,融資金額高達(dá)數(shù)億元人民幣。