人物專訪監(jiān)管
制造芯片
6G運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

北京人形機(jī)器人創(chuàng)新中心開(kāi)源 Pelican-VL 1.0 模型,號(hào)稱“全球最強(qiáng)”
11 月 14 日消息,北京人形機(jī)器人創(chuàng)新中心昨晚宣布全面開(kāi)源具身智能 VLM 模型 ——Pelican-VL 1.0。
IT之家從官方介紹獲悉,該模型覆蓋 7B、72B 參數(shù)規(guī)模,是迄今為止“最大規(guī)模的開(kāi)源具身多模態(tài)大模型”,同時(shí),也是迄今為止全球性能最強(qiáng)大的具身智能 VLM 模型。根據(jù)測(cè)試,其性能超越 GPT-5 同類模型 15.79% ,與 Google gemini 系列模型相比提升 19.25%,同時(shí)也超越通義千問(wèn)、書(shū)生萬(wàn)象等國(guó)內(nèi)模型,成為了目前最強(qiáng)的開(kāi)源具身多模態(tài)大模型。

文章稱,該團(tuán)隊(duì)還提出了一套全新的 DPPO(刻意訓(xùn)練)訓(xùn)練范式,是全球首創(chuàng)的具身多模態(tài)大模型后訓(xùn)練自進(jìn)化算法框架。憑借 DPPO,Pelican-VL 實(shí)現(xiàn)‘性能最強(qiáng)’這一目標(biāo)使用的數(shù)據(jù)量為 200K,僅僅是其他大模型的 1/10 甚至 1/50,是名副其實(shí)的開(kāi)源 VLM 性價(jià)比之王。
Pelican-VL 1.0 的開(kāi)源,能夠大幅提升具身智能在商業(yè)服務(wù)、工業(yè)泛工業(yè)、高危特種作業(yè)、家庭服務(wù)等多種真實(shí)場(chǎng)景中,通過(guò)視覺(jué)-語(yǔ)言感知輔助多步任務(wù)規(guī)劃的能力。而 VLM 作為目前實(shí)現(xiàn)機(jī)器人全自主的核心,Pelican 的開(kāi)源也將推動(dòng)我國(guó)具身智能全自主發(fā)展。

本次開(kāi)源的 Pelican-VL 1.0 的核心優(yōu)勢(shì)在于深度整合海量數(shù)據(jù)與自適應(yīng)學(xué)習(xí)機(jī)制,在由 1000+ A800 GPU 組成的集群上訓(xùn)練,單次檢查點(diǎn)訓(xùn)練耗費(fèi)超過(guò) 50,000 A800 GPU-小時(shí);團(tuán)隊(duì)從原始數(shù)據(jù)中蒸餾出的包含數(shù)億 token 的高質(zhì)量元數(shù)據(jù)以做訓(xùn)練基石。基于上述優(yōu)勢(shì),Pelican-VL 1.0 實(shí)現(xiàn)了在基線基礎(chǔ)上性能提升 20.3%,平均超過(guò) Qwen3-VL 系列、InternVL3.5 系列等同級(jí)別開(kāi)源模型 10.6%。
得益于“刻意練習(xí)”DPPO(Deliberate Practice Policy Optimization)訓(xùn)練范式,Pelican-VL 就像一名刻苦鉆研的學(xué)生:每次訓(xùn)練循環(huán)都會(huì)“看視頻 — 自主練習(xí) — 發(fā)現(xiàn)錯(cuò)誤 — 糾正提升”。通過(guò) DPPO 模仿人類元認(rèn)知的學(xué)習(xí)方式,通過(guò)強(qiáng)化學(xué)習(xí)(RL)探索弱點(diǎn)、生成失敗樣本,再進(jìn)行有針對(duì)性地監(jiān)督微調(diào)(SFT),讓模型不斷自我糾錯(cuò)和迭代進(jìn)步。
就像學(xué)生做錯(cuò)題后總結(jié)經(jīng)驗(yàn)一樣,Pelican-VL 能在訓(xùn)練中發(fā)現(xiàn)“薄弱知識(shí)點(diǎn)”并補(bǔ)齊,從而持續(xù)提高在視覺(jué)-語(yǔ)言和具身任務(wù)上的能力。通過(guò)這種機(jī)制,Pelican-VL 能夠更準(zhǔn)確地理解圖像內(nèi)容、語(yǔ)言指令和物理常識(shí),最終在決策和操作執(zhí)行環(huán)節(jié)中,實(shí)現(xiàn)了具身智能在空間-時(shí)間推理和動(dòng)作規(guī)劃方面的大幅突破。
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
聞庫(kù):6G發(fā)展是持續(xù)演進(jìn)、逐步上臺(tái)階的過(guò)程
11月13日消息,在“2025年6G發(fā)展大會(huì)”上,中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)理事長(zhǎng)聞庫(kù)發(fā)表演講指出,6G發(fā)展不是一步到位的過(guò)程,而是一個(gè)持續(xù)演進(jìn)、逐步上臺(tái)階的過(guò)程。
..[詳細(xì)]AI驅(qū)動(dòng)世界,Gartner2026重要戰(zhàn)略技術(shù)趨勢(shì)里的三位新英雄
近年來(lái),業(yè)界總是在談?wù)撝鳤I改變一切,將其又一次奉為“工業(yè)革命”級(jí)別的技術(shù)。不久前,在Gartner發(fā)布的2026年十大戰(zhàn)略技術(shù)趨勢(shì)中,與AI直接相關(guān)或以AI為核心的技術(shù),達(dá)到了至少6項(xiàng),包括:A..[詳細(xì)]
天地織網(wǎng):空天地網(wǎng)絡(luò)里的強(qiáng)國(guó)路
當(dāng)空天地一體化網(wǎng)絡(luò)走進(jìn)人們的視野,這張網(wǎng)把天上的衛(wèi)星、空中的無(wú)人機(jī)和地面的5G基站擰成一股繩,構(gòu)建起一張覆蓋全球98%區(qū)域的“通信天羅地網(wǎng)”。從極地科考到遠(yuǎn)洋航行,從應(yīng)急救援到日常通..[詳細(xì)]
全球人工智能標(biāo)準(zhǔn)加快提速,多重挑戰(zhàn)仍需破局
當(dāng)前,人工智能技術(shù)正以前所未有的速度重構(gòu)全球產(chǎn)業(yè)格局,人工智能標(biāo)準(zhǔn)化成為全球治理與技術(shù)協(xié)同的重要抓手,重要性日益凸顯,但部分亟需關(guān)注的問(wèn)題也逐漸顯現(xiàn)。在2025年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)..[詳細(xì)]
物理AI賦能出行,全場(chǎng)景智駕時(shí)代真的來(lái)了!
2025年的智能駕駛賽道,早已告別 “誰(shuí)先實(shí)現(xiàn)高速 NOA”“誰(shuí)的傳感器更多”的初級(jí)競(jìng)爭(zhēng)階段 —— 當(dāng)頭部企業(yè)陸續(xù)攻克城市道路基本場(chǎng)景后,全行業(yè)正集體陷入一場(chǎng) “進(jìn)階性焦灼”:智駕系統(tǒng)能 “..[詳細(xì)]












