工控網(wǎng)首頁
>

新聞中心

>

企業(yè)公告

>

高瓴、藍馳領投靈初智能,強化學習開啟具身智能初紀元

高瓴、藍馳領投靈初智能,強化學習開啟具身智能初紀元

2024/11/13 13:17:51

近日,靈初智能完成天使輪融資,本輪融資由高瓴創(chuàng)投(GL Ventures)和藍馳創(chuàng)投(Lanchi Ventures)領投。本輪融資完成后,靈初智能將繼續(xù)推進基于強化學習算法的機器人技能集訓練、場景化的數(shù)據(jù)生成及采集、端到端解決方案的研發(fā)及落地,打造業(yè)界領先的通用靈巧操作智能體。

靈初智能創(chuàng)始人王啟斌博士在手機、智能音箱、機器人領域有近20年的成功操盤經(jīng)驗,多次實現(xiàn)產(chǎn)品從定義、開發(fā)、到上市、再到全球化0-1-N的產(chǎn)業(yè)閉環(huán),是一名深諳機器人商業(yè)化落地的“老兵”。聯(lián)合創(chuàng)始人柴曉杰博士,在機器人及無人駕駛領域從業(yè)15年,擅長算法、仿真、工程、全棧技術,有L4產(chǎn)品落地的數(shù)據(jù)閉環(huán)經(jīng)驗,是量產(chǎn)經(jīng)驗豐富的研發(fā)專家。

靈初智能還被稱為“科學家密度最高”的具身智能公司。靈初與北京大學成立北大-靈初智能具身靈巧操作聯(lián)合實驗室,由人工智能研究院楊耀東博士擔任聯(lián)合實驗室項目負責人開展橫向課題合作。楊耀東博士是強化學習領域的知名青年學者,他博士畢業(yè)于UCL, 是現(xiàn)代深度強化學習的發(fā)源地。楊耀東課題組在強化學習領域有系列重要成果,其中包括帶領華人團隊研發(fā)多體強化學習算法首登Nature機器智能子刊,帶領華人團隊獲得NeurIPS 2022具身靈巧操作冠軍等。

同時,北大-靈初聯(lián)合實驗室將和梁一韜博士就具身智能體長程任務規(guī)劃開展課題合作,梁博士長期致力于如何將知識注入機器學習中以提高其性能和泛化性,在開放環(huán)境MineCraft中取得系列重要成果。他利用LLM實現(xiàn)復雜任務的拆解和規(guī)劃,讓大模型“缸中之腦“長出手腳,在具身場景中自主行動。

在靈初北大聯(lián)合實驗室之外,公司聯(lián)合創(chuàng)始人陳源培是一名癡迷機器人的00后天才少年,作為Stanford訪問學者,他師從Karen Liu和李飛飛教授,曾在全球首次實現(xiàn)利用強化學習在真實世界同時控制雙臂、雙手多技能操作。此外,來自上海交大人工智能學院的溫穎副教授也是技術團隊關鍵成員,溫教授課題組曾推出多模態(tài)決策大模型DB1,實現(xiàn)了對DeepMind通才決策Gato模型的超越,并引入了與現(xiàn)實世界相關的百余個場景任務,為實際業(yè)務需求提供了有力工具。

由產(chǎn)品老兵帶隊,攜手密度最高的科學家團隊,靈初智能組成了7890六邊形戰(zhàn)隊,團隊跨越了70、80、90、00的年齡梯度,是一支有技術、懂產(chǎn)品、能落地的全能團隊。就像他們擅長基于強化學習(RL)的具身智能類人操作一樣,具有更領先的技術,更大的商業(yè)潛力,和更強的戰(zhàn)斗力。

高泛化性、高靈巧性和高成功率是具身智能的 “不可達三角”。高泛化性指機器人在變化環(huán)境對不同物體執(zhí)行復雜任務,高靈巧性體現(xiàn)在執(zhí)行任務的精確靈活(如搭樂高、雙手操作等),高成功率即機器人受干擾時穩(wěn)定正確執(zhí)行任務(產(chǎn)品驗證階段成功率 95%、規(guī)?;涞馗哂?99.9%)。

兼顧這三者極具挑戰(zhàn)。高泛化性需通用模型和注重數(shù)據(jù)多樣性的學習算法,高靈巧性需要精細模型和關注精度細節(jié)的學習算法及特定控制算法,魯棒性也對控制算法有要求。強化學習是提升具身智能體這三方面性能的核心技術,能讓智能體在仿真環(huán)境利用低成本合成數(shù)據(jù)訓練,實現(xiàn)自主探索、試錯學習最優(yōu)解,提升靈巧性甚至超越人類上限,還能增強魯棒性。

靈初智能早期一直深耕基于強化學習的全棧能力,從靈巧操作入手在具身智能領域積累技術壁壘,后將擴展至通用泛化操作。其開發(fā)的分層端到端模型領先業(yè)界,包含Psi-P0規(guī)劃模型和Psi-C0控制模型。Psi-P0借助大模型交互推理理解行為對環(huán)境影響,拆解復雜任務以實現(xiàn)任務泛化;Psi-C0模型為陳源培提出的雙層架構,結合人類運動數(shù)據(jù)和深度強化學習,上層用人類數(shù)據(jù)訓練參考軌跡生成器,下層用其生成軌跡指導強化學習訓練,解決泛化性和靈巧性難題,這也是世界首次利用強化學習在現(xiàn)實中控制雙臂雙手多技能操作。

Psi-C0控制模型支持多個技能串聯(lián)作業(yè)的訓練難題。陳源培與斯坦福大學共同提出的Sequential Dexterity通過串聯(lián)多個靈巧操作策略來完成長程的任務。在真實世界的搭積木任務中,能將翻找、重定向、抓取和插入積木4個skill串聯(lián)起來提高整體的成功率。這也是世界上第一個基于強化學習實現(xiàn)了靈巧操作的長程任務,顯示了多技能組合的泛化性。

梁一韜博士開發(fā)的Psi-P0實現(xiàn)開放環(huán)境中復雜任務的任務拆解和規(guī)劃。其所支持的任務復雜度和準確度都超越同期OpenAI(VPT)和Nvidia的工作(Minedojo)。如下面視頻所示,我們可以進一步通過構建memory使具身模型具有l(wèi)ifelong learning,即根據(jù)自身經(jīng)歷自我提升的能力。

在產(chǎn)品規(guī)劃上,靈初智能將從2B服務業(yè)切入,以頭部客戶的高價值場景需求為指引,開發(fā)整合技能集,實現(xiàn)商業(yè)落地,并快速迭代硬件,算法,數(shù)據(jù)系統(tǒng),不斷提升具身智能整體解決方案的泛化性,靈巧性和成功率,給出具身領域“不可達三角”的最優(yōu)解。

靈初智能創(chuàng)始人兼CEO王啟斌表示:“非常感謝投資人的鼎力支持。我們這支集合工業(yè)界老兵和高密度科學家的戰(zhàn)隊,擁有完整的技術棧,將在具身智能的前沿打造軟硬一體的綜合解決方案,拓展在先進制造,商超物流及2B服務業(yè)等場景中的應用場景,快速實現(xiàn)數(shù)據(jù)閉環(huán),商業(yè)化落地。在具身智能賽道的初紀元,期待和我們的合作伙伴靈性成長,共同開創(chuàng)智能未來?!?/p>

高瓴創(chuàng)投(GL Ventures)項目負責人表示:“作為人工智能與現(xiàn)實世界的深度結合,具身智能行業(yè)前景廣闊,且擁有引發(fā)各行各業(yè)深刻變革的巨大潛力。靈初智能憑借在強化學習和模仿學習方面的技術深耕和積累,在實現(xiàn)機器人靈巧性、泛化性和高成功率的‘不可達三角’挑戰(zhàn)上已取得顯著進展;創(chuàng)始團隊匯聚多領域頂尖人才,不僅有卓越的技術背景,還兼?zhèn)鋸姶蟮墓こ袒芰σ约吧詈竦纳虡I(yè)化實戰(zhàn)經(jīng)驗。我們相信,在創(chuàng)始人王啟斌博士帶領下,靈初智能能夠為行業(yè)帶來革命性的應用與高效率的解決方案,實現(xiàn)技術突破與商業(yè)價值的共贏?!?/p>

藍馳創(chuàng)投(Lanchi Ventures)項目負責人表示:“具身智能機器人市場潛力巨大,我們認為通用操作能力執(zhí)行復雜任務是具身智能落地的重要技術卡點。靈初團隊是全球范圍內(nèi)在強化學習和具身模型方面頂尖的技術團隊。此外,團隊懂產(chǎn)業(yè)懂場景,具備底層技術架構能力和充分的產(chǎn)品落地經(jīng)驗和供應鏈優(yōu)勢。我們相信隨著具身智能的技術逐步成熟、產(chǎn)業(yè)鏈與生態(tài)更加完善,具身智能機器人市場將迎來高速發(fā)展期。我們非??春镁呱頇C器人在全球市場的發(fā)展?jié)摿??!?/p>

關于靈初智能:

靈初智能公司的英文全稱是Proto-Sentient Intelligence,縮寫為PsiBot。Proto就是“初”,有原初、先驅(qū)的意思,這和公司主打的以強化學習為優(yōu)勢的具身智能創(chuàng)新技術路線非常符合;Sentient是“靈”,有智識、靈性的意思,代表了能一點點自主完成對世界認知和交互的類人操作。正如它的名字,靈初智能將憑借最前沿創(chuàng)新的技術讓具身智能應用擁有靈性,開啟機器人時代的初紀元。


審核編輯(
黃莉
)
投訴建議

提交

查看更多評論
其他資訊

查看更多

中國聯(lián)通趙爍:以專業(yè)與創(chuàng)新,深耕證券保險金融領域服務

Raythink燧石技術雙光測溫卡片熱像儀發(fā)布,狹小空間、近距離溫度可視化神器

匯智提質(zhì):開啟未來新篇章!第25屆CIBIS建筑智能化峰會成都站成功舉辦!

智慧引領 雙碳未來 | 第25屆CIBIS建筑智能化峰會西安站成功舉辦!

走進智能工廠,見證卓越智造的力量