Figure:為人類部署數(shù)十億臺(tái)人形機(jī)器人
編譯:Lavida,,zhoujin
編輯:Siqi
排版:Scout
本文編譯自 Peter H.Diamandis 和 Figure 創(chuàng)始人 Brett Adcock 的訪談。
Brett Adcock 是一位成功的連續(xù)創(chuàng)業(yè)者,,在其創(chuàng)立的 eVTOL 公司 Archer Aviation 成功 IPO 之后,,更早之前,他創(chuàng)立的 Vettery 則以 1 億美元被收購(gòu),。今年年初,,Brett Adcock ?宣布創(chuàng)立了通用人形機(jī)器人 Figure,并表示自己會(huì)投入至少 1 億美元到 Figure,。Figure 的目標(biāo)是開(kāi)發(fā)能夠在不同環(huán)境中工作并處理各種任務(wù)的通用型人形機(jī)器人,,從倉(cāng)儲(chǔ)到零售,甚至看護(hù)服務(wù),。上個(gè)月,,Brett 發(fā)布了 Figure 的第一款通用人形機(jī)器人 Figure 01 行走的視頻。
在本篇訪談中,,Brett 分享了 Figure 01 是如何被設(shè)計(jì)的,,以及他對(duì)于通用人形機(jī)器人領(lǐng)域的預(yù)期,。Brett 認(rèn)為人形機(jī)器人研發(fā)一定是軟硬件一體的過(guò)程,,LLM 為機(jī)器人提供了強(qiáng)大的大腦,是軟件層面的重要補(bǔ)足,,而硬件角度,,幾乎沒(méi)有成熟的供應(yīng)鏈可供使用,要求團(tuán)隊(duì)在設(shè)計(jì)產(chǎn)品的同時(shí)就要考慮到機(jī)器人重量,、計(jì)算處理,、現(xiàn)實(shí)環(huán)境等細(xì)節(jié)。
Figure 最先開(kāi)拓的商業(yè)場(chǎng)景是勞動(dòng)力市場(chǎng),,Brett Adcock 表示相較于取代人類就業(yè),,人形機(jī)器人最大的價(jià)值是解決勞動(dòng)力不足的現(xiàn)實(shí)情況,這些機(jī)器人可以被投入到經(jīng)濟(jì)活動(dòng)中做“Dangerous, dull, dirty”的工作,,讓體力勞動(dòng)成為人類的一種選擇而非負(fù)擔(dān),。
01.
Figure 是什么
Peter:可以簡(jiǎn)單介紹一下 Figure 嗎,?你們的使命和目標(biāo)是什么?
Brett:Figure 是一家 AI 機(jī)器人公司,,專注于設(shè)計(jì)自動(dòng)通用人形機(jī)器人(Autonomous General-purpose Humanoids),。自動(dòng)通用人形機(jī)器人是指具備自主能力,能夠自動(dòng)執(zhí)行多種任務(wù),,并且在外觀和行為上類似于人類的機(jī)器人,。我們的目標(biāo)是在長(zhǎng)期能夠部署和人類數(shù)量一樣多的人形機(jī)器人,讓體力勞動(dòng)成為一種選擇而非必然,。
我們所處世界的操作系統(tǒng)是與人類相適應(yīng)的,,例如門把手、倉(cāng)庫(kù)貨架,,設(shè)計(jì)初衷都是適應(yīng)人類的形態(tài)和能力,,而通用人形機(jī)器人就是一個(gè)系統(tǒng)的通用界面(General Purpose Interface),可以直接與我們的物理世界互動(dòng),。它的出現(xiàn)將為人類帶來(lái)諸多益處,,有助于解決勞動(dòng)力市場(chǎng)中的重要問(wèn)題,例如提高人們?cè)诠ぷ髦械纳a(chǎn)率,,減輕家務(wù)和護(hù)理老人的負(fù)擔(dān),。我們的遠(yuǎn)期計(jì)劃是在全球部署 100 億個(gè)人形機(jī)器人。
未來(lái) 1-2 年內(nèi),,我們的重點(diǎn)將放在開(kāi)發(fā)具有里程碑意義的產(chǎn)品上,,希望在未來(lái)一兩年內(nèi),能向公眾展示大量人形機(jī)器人產(chǎn)品的研發(fā)成果,,包括 AI 系統(tǒng),、低級(jí)控制(Low-Level Control)等,最終展示能在日常生活中發(fā)揮作用的機(jī)器人,。
低級(jí)控制(low-level control))是機(jī)器人或自動(dòng)化系統(tǒng)的基礎(chǔ),,它們負(fù)責(zé)處理底層的物理操作,主要包括運(yùn)動(dòng)控制,、傳感器反饋,、實(shí)時(shí)響應(yīng)、硬件控制等,。
Peter:你預(yù)計(jì)到 2030 年或 2040 年,,地球上會(huì)有多少個(gè)人形機(jī)器人?
Brett:在接下來(lái)的幾十年里,,我們真正面臨的挑戰(zhàn)將是如何擴(kuò)大人形機(jī)器人的生產(chǎn)規(guī)模,,以及如何將足夠數(shù)量的人形機(jī)器人供應(yīng)到市場(chǎng),。長(zhǎng)期來(lái)看,每個(gè)人,、每個(gè)家庭都會(huì)想要一個(gè)人形機(jī)器人,,就像現(xiàn)在的汽車或手機(jī)一樣。并且在勞動(dòng)力市場(chǎng)上也會(huì)有數(shù)十億個(gè)人形機(jī)器人,,去做那些對(duì)人類來(lái)說(shuō)危險(xiǎn),、單調(diào)和乏味的工作。人形機(jī)器人也將應(yīng)用于航空事業(yè),,例如在太空中建立人類居住點(diǎn),、照看老人等各類工作場(chǎng)景。如果給我們足夠長(zhǎng)的時(shí)間去進(jìn)行大規(guī)模制造,,我們可以制造出數(shù)十億個(gè)人形機(jī)器人,。
短期內(nèi),人型機(jī)器人的性能以及可靠性是主要的限制因素,,F(xiàn)igure 正在努力解決這個(gè)問(wèn)題,,我們希望能在兩年內(nèi)完成實(shí)際生活的機(jī)器人應(yīng)用測(cè)試演示。
Peter:如果能成功降低制造成本,、提高生產(chǎn)量,,一個(gè)功能完善的人形機(jī)器人制作成本能降低多少?
Brett:如果我們回顧消費(fèi)品或汽車行業(yè)的發(fā)展歷史時(shí),,可以看到產(chǎn)品的價(jià)格與生產(chǎn)量之間存在強(qiáng)相關(guān),。根據(jù)經(jīng)驗(yàn)曲線(Experience Curve),每當(dāng)生產(chǎn)數(shù)量翻倍,,產(chǎn)品的價(jià)格或成本就可能下降 20%或 30%,。因此,我們可以認(rèn)為價(jià)格取決于生產(chǎn)量,。
Experience Curve
經(jīng)驗(yàn)曲線(Experience Curve)是一個(gè)經(jīng)濟(jì)學(xué)概念,,隨著個(gè)體或組織在特定領(lǐng)域的生產(chǎn)量增加,經(jīng)驗(yàn)的積累會(huì)帶來(lái)生產(chǎn)效率的提高,,生產(chǎn)成本將會(huì)下降,。
這個(gè)原理同樣適用于人形機(jī)器人的生產(chǎn),。目前,,一個(gè)人形機(jī)器人大約有 1000 個(gè)零件,重量約為 150 磅(68 公斤),。相比之下,,一個(gè)電動(dòng)汽車可能有大約 1 萬(wàn)個(gè)零件,重量可能在 4000-5000 磅(1800-2250 公斤)之間,。
因此,,從長(zhǎng)期來(lái)看,,一個(gè)人形機(jī)器人的成本應(yīng)該低于一臺(tái)廉價(jià)電動(dòng)汽車。這主要取決于機(jī)器人的執(zhí)行器,、電機(jī)組件,、傳感器的成本以及計(jì)算成本。
Peter:關(guān)于生產(chǎn)速度,,未來(lái)幾年內(nèi)有可能生產(chǎn)幾百臺(tái) Figure 機(jī)器人嗎,?你預(yù)計(jì)到 2030 年會(huì)達(dá)到什么水平?
Brett:現(xiàn)階段我們需要先打造出更成熟的產(chǎn)品,,才能進(jìn)一步考慮生產(chǎn)速度的問(wèn)題,。我們當(dāng)前面臨的主要問(wèn)題是確保人形機(jī)器人在客戶場(chǎng)景中的實(shí)用性、安全性和可靠性,,讓機(jī)器人能夠持續(xù)運(yùn)行,,不出故障,并且不需要大量人員來(lái)維護(hù)和操作,。否則,,機(jī)器人的價(jià)值就沒(méi)法體現(xiàn)了。也無(wú)法為客戶創(chuàng)造理想的回報(bào)率,。
如果我們能夠做到的話,,我相信我們有能力在未來(lái)幾十年內(nèi)生產(chǎn)數(shù)千萬(wàn)個(gè)人形機(jī)器人。以 Tesla 和福特汽車為例,,它們分別花了 10 年以上的時(shí)間生產(chǎn)并投放市場(chǎng) 100 萬(wàn)輛汽車,。如果我們的目標(biāo)是全球范圍內(nèi)投放 100 萬(wàn)臺(tái)機(jī)器人,可能需要 5 年或者 10-12 年的時(shí)間,。
與制造汽車相比,,制造機(jī)器人的過(guò)程更加簡(jiǎn)單。特斯拉 Model 3 有大約 1 萬(wàn)個(gè)零件,,而我們的機(jī)器人只有大約 1 千個(gè)零件,,并且更輕巧。
因此,,我認(rèn)為在這 10 年的后半段,,我們可以以相當(dāng)高的產(chǎn)量進(jìn)行機(jī)器人制造。但在接下來(lái)的 2-4 年內(nèi),,我們的首要目標(biāo)是制造出實(shí)用的人形機(jī)器人,。
Peter:AI 已經(jīng)能夠用于編寫其他 AI 程序了,你認(rèn)為你們也會(huì)利用機(jī)器人來(lái)協(xié)助制造機(jī)器人,,從而形成一種反饋循環(huán)嗎,?
歡迎關(guān)注海外獨(dú)角獸視頻號(hào)
獲取最前沿的科技行業(yè)資訊
Brett:是的,我們的目標(biāo)是在制造過(guò)程中只有人形機(jī)器人來(lái)制造人形機(jī)器人。我覺(jué)得在制造過(guò)程中任何需要人類勞動(dòng)力的工作都會(huì)發(fā)生重大變革,,我們上周參觀的汽車制造基地到處都有巨大的機(jī)器臂,,數(shù)量多達(dá)數(shù)百個(gè),那是我一生中見(jiàn)過(guò)的自動(dòng)化程度最高的地方之一,,但還有另外約 10,000 名員工在工作,。
Peter:工廠制造應(yīng)該是人形機(jī)器人最先投入應(yīng)用的地方,機(jī)器人離家用還有多遠(yuǎn),?
Brett:人形機(jī)器人會(huì)優(yōu)先在相對(duì)更結(jié)構(gòu)化的環(huán)境中得到應(yīng)用,,所以相較于復(fù)雜多變的家庭環(huán)境,工廠制造的產(chǎn)品具有更清晰一致的規(guī)格和參數(shù),,生產(chǎn)過(guò)程更易于統(tǒng)一和自動(dòng)化,,也更容易控制成本、保證安全性,,因此工廠會(huì)是最初的應(yīng)用場(chǎng)景,。
為了讓人形機(jī)器人的操作技能、高級(jí)行為和感知策略更加成熟,,我們需要將這些機(jī)器人投入到企業(yè)勞動(dòng)力市場(chǎng)中,,并建立一個(gè)全面的 AI 數(shù)據(jù)管道(AI data pipeline),這個(gè)過(guò)程需要時(shí)間,。我的推測(cè)是預(yù)計(jì)到 2030 年左右,,我們有可能看到人形機(jī)器人在家庭環(huán)境中的廣泛應(yīng)用。
Peter:讓人形機(jī)器人成為可能的一個(gè)關(guān)鍵因素是 AI 能力的飛躍,,而具有物理實(shí)體的 AI 機(jī)器人將在 AI 的進(jìn)化中扮演重要角色,。一個(gè)被裝在盒子里或只能通過(guò)攝像頭或揚(yáng)聲器觀察外界的 AI,與能真正與物理世界互動(dòng)的 AI 有很大不同,,你怎么看,?
Brett:我相信,最終我們將有能力對(duì) AGI 產(chǎn)生重大影響,。2023 年大家持續(xù)討論的一個(gè)問(wèn)題是,,在模型訓(xùn)練和規(guī)模拓展中,一旦互聯(lián)網(wǎng)上沒(méi)有足夠的文本用來(lái)訓(xùn)練新一代模型,,AGI 是否還能實(shí)現(xiàn),?我認(rèn)為,通過(guò)人形機(jī)器人與環(huán)境互動(dòng)來(lái)獲取人類數(shù)據(jù),,并使用視覺(jué)語(yǔ)言模型來(lái)理解和處理這些數(shù)據(jù),,可能會(huì)是能持續(xù)推進(jìn) AGI 研究向前的一個(gè)主要途徑,雖然這可能需要更長(zhǎng)時(shí)間,。
Peter:Figure 的團(tuán)隊(duì)是如何組建的,?
Brett:我一直在努力找到世界上最優(yōu)秀的人才,還有那些鮮為人知的小眾實(shí)驗(yàn)室,,以更深入地了解執(zhí)行器或運(yùn)動(dòng)控制,。同時(shí),我也在看書學(xué)習(xí)全身逆動(dòng)力學(xué)(whole-body inverse dynamics)或 NPC 控制器(NPC controller)等相關(guān)知識(shí),,我花了大量時(shí)間在這上面,。
全身逆動(dòng)力學(xué)(whole-body inverse dynamics)是機(jī)器人控制領(lǐng)域的一個(gè)概念,它涉及研究和計(jì)算機(jī)器人身體各部分的運(yùn)動(dòng)和受力情況,,以便更好地理解和控制機(jī)器人的運(yùn)動(dòng),。這個(gè)概念通常用于開(kāi)發(fā)機(jī)器人的動(dòng)態(tài)控制系統(tǒng),以使機(jī)器人能夠在執(zhí)行任務(wù)時(shí)保持平衡,、穩(wěn)定和高效,。
NPC 控制器(NPC controller)是一種用于控制機(jī)器人的控制算法,它代表“非線性模型預(yù)測(cè)控制”(Nonlinear Model Predictive Control),。這種控制方法使用機(jī)器人的數(shù)學(xué)模型來(lái)預(yù)測(cè)未來(lái)的運(yùn)動(dòng)和行為,,然后根據(jù)這些預(yù)測(cè)來(lái)生成控制命令,以實(shí)現(xiàn)所期望的機(jī)器人行為,。NPC 控制器通常用于高級(jí)機(jī)器人應(yīng)用,,如動(dòng)態(tài)步行、操縱和避障等領(lǐng)域,,以提高機(jī)器人的性能和穩(wěn)定性,。
作為初創(chuàng)公司的創(chuàng)始人,最重要的是證明你能做出來(lái)產(chǎn)品,,即使是一個(gè)最小可行產(chǎn)品(MVP),,因?yàn)槲覀兊哪繕?biāo)都是推出產(chǎn)品或服務(wù)。在創(chuàng)立 Archer 的時(shí)候,,我在佛羅里達(dá)大學(xué)建了一個(gè) 372 平方米的 Archer Aviation eVTOL 實(shí)驗(yàn)室,,與一個(gè)博士團(tuán)隊(duì)合作在那里制造了第三、四代電動(dòng)飛行器,,這個(gè)過(guò)程讓我對(duì)技術(shù)原理和產(chǎn)品的認(rèn)證決策(certification decisions)有了更深入的了解,。
如果能事先知道 Archer 和 Figure 有多難,也許就不會(huì)有人去做了,,因?yàn)樗鼈兇_實(shí)非常有挑戰(zhàn)性,。我當(dāng)時(shí)完全沒(méi)有意識(shí)到供應(yīng)鏈的成熟度問(wèn)題,很多機(jī)器人的初創(chuàng)公司也是,。他們可能會(huì)認(rèn)為硬件采購(gòu)很容易,,真正的難題在于軟件,但實(shí)際情況并非如此,。因?yàn)橐屲浖樌\(yùn)行就需要優(yōu)質(zhì)的硬件,,特別是對(duì)于 eVTOL 飛行器和 Figure 機(jī)器人,獲取硬件供應(yīng)非常困難。
Peter:在 Figure 公司的發(fā)展過(guò)程中,,有哪些技術(shù)層面的限制推動(dòng)你做出了當(dāng)前的決策,?是電池壽命、材料重量或者 AI 嗎,?
Brett:我們花了很多時(shí)間來(lái)了解需求,,整個(gè)設(shè)計(jì)流程非常嚴(yán)格,也進(jìn)行了大量的交易研究,,確保我們能夠做出正確決策,。
我們很多決定都取決于硬軟件的供應(yīng)鏈情況,其中驅(qū)動(dòng)器(actuator),、中間件(middleware),、操作系統(tǒng)、電池,、控制軟件(control software)是主要的限制因素,,一些情況下感知系統(tǒng)是比較容易獲得并內(nèi)置于機(jī)器人中的。
我本來(lái)以為能很容易買到現(xiàn)成的,,但市場(chǎng)上根本沒(méi)有好的驅(qū)動(dòng)器,、電池、控制軟件和中間件操作系統(tǒng)解決方案,。傳感器雖然有一些現(xiàn)成的,,但我們幾乎都是自己制造下一代機(jī)器人的電子元件,并不是因?yàn)槲覀兿?,而是不得不?/p>
Figure 研制的執(zhí)行器(左) vs?
具有相同扭矩的現(xiàn)成執(zhí)行器(右)
Source: IEEE Spectrum
02.
如何設(shè)計(jì)一臺(tái)人形機(jī)器人
Peter:Figure 機(jī)器人的身高是大概 168 cm,,這個(gè)高度不會(huì)讓人類感到害怕,同時(shí)又足夠接觸到貨架頂層,,你們?cè)谠O(shè)計(jì)的時(shí)候是如何考慮的,?
Brett:我們?cè)谠O(shè)計(jì)機(jī)器人身高的時(shí)候經(jīng)歷了一個(gè)復(fù)雜的決策過(guò)程,因?yàn)檫@個(gè)過(guò)程中的兩個(gè)決定性因素之間是互相矛盾的,,我們需要在二者之間找到平衡,。
一方面,從物理角度來(lái)看,,機(jī)器人身高低于 168cm 是最理想的,,因?yàn)檫@樣的設(shè)計(jì)可以降低能源消耗、增強(qiáng)穩(wěn)定性,,并且較矮的機(jī)器人部件更易于控制,,并且在跌倒時(shí)能更快地恢復(fù)平衡。
然而,,從商業(yè)實(shí)用性角度上,,我們又需要機(jī)器人有足夠長(zhǎng)的手臂,、可以靈活從高處和低處獲取物品,就像“神探加杰特”(Inspector Gadget )中的機(jī)器人那樣具有超人的能力,。
因此,,綜合考慮這兩方面的因素,我們確定了這個(gè)高度作為理想身高,。我們正在設(shè)計(jì)的下一代機(jī)器人會(huì)和第一代產(chǎn)品的身高保持一致,。
Inspector Gadget 中擁有超長(zhǎng)手臂的特工
Peter:你認(rèn)為機(jī)器人有必要看起來(lái)和人類一模一樣嗎,?
Brett:根據(jù)恐怖谷效應(yīng),,當(dāng)機(jī)器人的外觀越來(lái)越接近人類時(shí),人們對(duì)它的信任感會(huì)增加,,但是當(dāng)它們過(guò)于接近人類時(shí),,人們會(huì)感到不安和恐懼。所以我們的目標(biāo)并不是追求讓機(jī)器人在外觀上看起來(lái)像人類,,比如說(shuō)有五官和表情,,而是希望機(jī)器人在功能上能夠模仿人類的操控和移動(dòng)能力。這樣的話機(jī)器人就能夠執(zhí)行需要與人類操作系統(tǒng)交互的任務(wù),。
這也意味著我們無(wú)需改變工作環(huán)境,,就能將機(jī)器人投入到人類不愿意從事的工作中,比如倉(cāng)庫(kù)管理和制造業(yè),,或者做家務(wù),。這正是人形機(jī)器人的目的。我們的最終目標(biāo)是讓機(jī)器人融入經(jīng)濟(jì)活動(dòng)中,,從事對(duì)人類有用且有益的工作,。
Peter:據(jù)你了解現(xiàn)在市場(chǎng)上有多少人形機(jī)器人公司?比如很多人都知道特斯拉的 Optimus 機(jī)器人,,現(xiàn)在應(yīng)該也聽(tīng)說(shuō)過(guò) Figure ,,你覺(jué)得還有多少公司像你們一樣募到了充足的資金來(lái)發(fā)展人形機(jī)器人?
Brett:我們關(guān)注到的應(yīng)該已經(jīng)獲得融資的有 6 個(gè)左右,,過(guò)去十年大多數(shù)人形機(jī)器人項(xiàng)目仍處于研發(fā)階段,,比如 Boston Dynamics 的 Atlas。美國(guó)也有許多非常優(yōu)秀的實(shí)驗(yàn)室,,比如加州理工學(xué)院和 UC Berkeley 也展示過(guò)他們的一些研究成果,。
商業(yè)化方面,我們會(huì)去看這幾個(gè)公司是不是商業(yè)化團(tuán)隊(duì),,研發(fā)的機(jī)器人是否可以行走,,以及有沒(méi)有手。據(jù)我們所知,,目前只有我們和特斯拉的 Optimus 滿足這三個(gè)特質(zhì),。
Peter:我們的 Abundance 360 CEO 峰會(huì)每年都會(huì)聚焦不同的機(jī)器人公司,。幾年前我們邀請(qǐng)了波士頓動(dòng)力的 Mark Robert,在峰會(huì)上演示了 Atlas 機(jī)器人,。去年來(lái)自英國(guó)的 Engineered Arts 公司展示了 Ameca 人形機(jī)器人,,她最大的特點(diǎn)是擁有面部表情,而且動(dòng)作非常類似人類,,雖然看起來(lái)有點(diǎn)怪,,但讓人感覺(jué)很新鮮。Ameca 接入的是 GPT-4,,Atlas 則是由自有系統(tǒng)驅(qū)動(dòng),。可能大部分人沒(méi)有意識(shí)到的是,,作為機(jī)器人,,Atlas 實(shí)際上非常重,它的液壓系統(tǒng)非常危險(xiǎn),。而你們?cè)谠O(shè)計(jì)時(shí)采取了不同的方法,,F(xiàn)igure 的重量相對(duì)較輕,不容易傷害到人,,可以介紹一下它的其他參數(shù)嗎,?
能實(shí)現(xiàn)表情功能的 Ameca 機(jī)器人
Source: Engineered Arts?
Brett:我們的目標(biāo)重量是 60 公斤,而現(xiàn)在 Figure 的實(shí)際重量略高于 61 公斤,,結(jié)果還是很理想的,,因?yàn)槲抑白龅暮芏囗?xiàng)目都有明顯的超重問(wèn)題,比如 Archer(拾象注:Archer Aviation 是 Brett 創(chuàng)立的一家專注于開(kāi)發(fā)電動(dòng)垂直起降(eVTOL)飛機(jī)的航空制造公司),。我們希望 Figure 在充滿電的狀態(tài)下能續(xù)航 5 小時(shí),,然后經(jīng)過(guò) ~2C 快速充電后再次投入工作。
C-rate(充電倍率)指充電電流相對(duì)電芯額定容量( Ah )的倍數(shù),,表示電池充電到最大容量所需要的時(shí)間,,是衡量電池充電速度的一個(gè)指標(biāo),C 前面的數(shù)字越大,,表示充電速度越快,。1C 表示電池在一小時(shí)內(nèi)可以充滿電,文中提到的 “2C 快速充電”就是說(shuō)電池在半小時(shí)內(nèi)可以充電到 100%,。
另外就是讓 Figure 能以幾米/秒的步行速度快走,,不需要跑步或沖刺,但有時(shí)候機(jī)器人可能需要在倉(cāng)庫(kù)里走大概 400 米,,所以想讓他走快點(diǎn),。
我們需要通過(guò)一些特定操作實(shí)現(xiàn)快速、可靠和安全的目標(biāo),,當(dāng)前的硬件已經(jīng)能夠完成大部分人類工作,,主要的限制在于軟件,。通過(guò)軟件更新,我們將會(huì)不斷提升機(jī)器人的能力,。
Peter:我很興奮你們專注于讓機(jī)器人模仿人類形態(tài),。我對(duì)另一件事情非常感興趣,那就是與肌肉相關(guān)的硬件設(shè)計(jì),。我曾經(jīng)讀過(guò)關(guān)于肌動(dòng)蛋白和肌肉收縮等方面的文章,,一直希望能研發(fā)出一種材料,只要施加電流就會(huì)像肌肉一樣收縮——這種材料將是人形機(jī)器人的理想驅(qū)動(dòng)器,,而不是傳統(tǒng)的旋轉(zhuǎn)或螺旋功能,。你是否了解這方面的研究?我們是否有望看到電機(jī)肌肉技術(shù)(Electromechanical Muscle-tech)的發(fā)展,?
Brett:人體的結(jié)構(gòu)非常復(fù)雜,,尤其是肌肉工作和關(guān)節(jié)運(yùn)動(dòng),。例如,,人的肩關(guān)節(jié)有三個(gè)自由度,所以我們的機(jī)器人需要通過(guò)三個(gè)不同的執(zhí)行器實(shí)現(xiàn)俯仰和翻滾,,這些執(zhí)行器被設(shè)計(jì)成按特定的順序依次激活或啟動(dòng),,以執(zhí)行復(fù)雜的運(yùn)動(dòng)任務(wù)。要使機(jī)器人達(dá)到與人類相似的自由度和效率非常困難,,所以在很長(zhǎng)時(shí)間內(nèi),,機(jī)器人與人類之間的差距將持續(xù)存在。
Figure 01 肩關(guān)節(jié)設(shè)計(jì)細(xì)節(jié)
Source: IEEE Spectrum
我們已經(jīng)研究了很多種技術(shù),,包括液壓技術(shù)以及其他類型的執(zhí)行器,,而不僅僅局限于旋轉(zhuǎn)或線性電機(jī)。我們的電機(jī)驅(qū)動(dòng)器(Electromechanical Actuator)可以滿足各種需求,,因?yàn)樗鼈兙哂凶銐虻哪芰?、?dòng)力和自由度以及合適的速度和扭矩來(lái)執(zhí)行這些任務(wù)。只要能夠滿足需求,,我們就可以進(jìn)行大批量生產(chǎn),,從而大幅降低生產(chǎn)成本。
我們還在進(jìn)行一些有趣的學(xué)術(shù)研究,,但我們認(rèn)為其中一些研究成果與實(shí)際應(yīng)用還有距離,,還不能將其應(yīng)用到一個(gè)人形機(jī)器人上,并在未來(lái)幾年內(nèi)進(jìn)行有用的工作,。
Peter:在 Figure 的設(shè)計(jì)中,,數(shù)據(jù)處理和計(jì)算任務(wù)是都在機(jī)器內(nèi)部進(jìn)行,還是需要部分在云端完成處理,?
Brett:我們所有的短期,、低級(jí)別的處理都在機(jī)身上操作,,所以我們需要在機(jī)器人上集成足夠強(qiáng)大的計(jì)算和圖形處理能力,以便運(yùn)行機(jī)器人內(nèi)部的計(jì)算機(jī),,來(lái)驅(qū)動(dòng)整個(gè)運(yùn)動(dòng)控制器,、運(yùn)行感知系統(tǒng)以及執(zhí)行我們所需的各項(xiàng)功能。
我們的機(jī)器人也具備與云端通信的能力,,因此對(duì)于一些不需要高帶寬,、不必?fù)?dān)心延遲問(wèn)題的任務(wù),例如規(guī)劃?rùn)C(jī)器人的下一步行動(dòng)等高級(jí)行為,,這些任務(wù)可以在云端進(jìn)行處理,。
總體而言,我們希望在機(jī)器人上盡可能多地完成任務(wù),,例如在一個(gè) 5G 信號(hào)不穩(wěn)定的環(huán)境中,,控制器仍能以非常快的頻率運(yùn)行,,所以我們的機(jī)器人需要具備在內(nèi)部高速完成大量任務(wù)的能力,。
Peter:關(guān)于機(jī)器人的視覺(jué)系統(tǒng),你們的方案是什么樣的,?完全使用攝像頭視覺(jué)(Camera Visual)方案還是使用激光雷達(dá),?
Brett:如果我們回顧消費(fèi)品或汽車行業(yè)的發(fā)展歷史時(shí),可以看到產(chǎn)品的價(jià)格與生產(chǎn)量之間存在強(qiáng)相關(guān),。根據(jù)經(jīng)驗(yàn)曲線的理論,,每當(dāng)生產(chǎn)數(shù)量翻倍,產(chǎn)品的價(jià)格或成本就可能下降 20%或 30%,。因此,,我們可以認(rèn)為價(jià)格是生產(chǎn)量的函數(shù)。
Peter:你是否關(guān)注過(guò)《星際迷航》中的 Data 機(jī)器人以及 R2-D2 ,、 C-3PO,?他們的哪些設(shè)計(jì)是值得借鑒的?哪些不太合理,?
Brett:我喜歡 C-3PO,,但我不太喜歡它手臂上帶有小型執(zhí)行器的杠桿式裝置。R2-D2 的形狀和結(jié)構(gòu)我覺(jué)得不太實(shí)用,,后部的加速器可能有些用處,。但其實(shí)我并不是《星際迷航》的科幻迷,我童年接觸更多的是阿西莫夫這些科幻作家的作品,。
星際迷航中的 Data 指揮官
Source: Memory Fandom
R2- D2 讓我想到,,很多人都建議我們給機(jī)器人裝上輪子,而不是采用雙足行走這種更復(fù)雜的方式,。
《星球大戰(zhàn)》中的 R2-D2 機(jī)器人
Source: Wikipedia
但我認(rèn)為固定輪距的設(shè)計(jì)是不合理的,,盡管采用這種設(shè)計(jì)的機(jī)械臂在市場(chǎng)上表現(xiàn)出色,,并且很多人也花了大量時(shí)間去實(shí)現(xiàn)這個(gè)設(shè)計(jì)。
考慮一個(gè)實(shí)際情況,,如果我們讓一臺(tái)輪式機(jī)器人進(jìn)入倉(cāng)庫(kù),,它需要具備垂直移動(dòng)的能力,這意味著它需要配備能夠上下移動(dòng)的電梯,。為了到達(dá)貨架的后面或者類似的地方,,你需要先把它推向前方,然后再向后倒車,。
為了完成這些復(fù)雜的動(dòng)作,,輪式機(jī)器人必須具備與雙足行走的機(jī)器人類似的復(fù)雜性、驅(qū)動(dòng)力和自由度,。因此,,那些試圖讓我把機(jī)器人建造成 R2-D2 樣式的建議實(shí)際上是不切實(shí)際的。
03.
為什么需要軟硬件一體開(kāi)發(fā)
Peter:Oculus 的創(chuàng)始人 Palmer Lucky 最近在做一家國(guó)防科技公司,,在外界看來(lái),,他們像是一個(gè)專注于硬件制造的公司,但實(shí)際他們做的大概是 60% 的軟件和 40% 的硬件,。Figure 的硬件和軟件的比例如何,?
Brett:如果包含做控制系統(tǒng)(control)、中間件(middleware)和自主決策與行動(dòng)能力(autonomy)的人,,我們的軟件占比會(huì)比硬件稍微多一些,因?yàn)橛布?team 的員工只有 15 個(gè)左右,,軟件規(guī)模要明顯大一些,。
長(zhǎng)遠(yuǎn)來(lái)看,軟件會(huì)成為公司最大的業(yè)務(wù)板塊,。Figure 作為一家專注于 AI 的公司,,以后會(huì)有一個(gè)龐大的 autonomy 團(tuán)隊(duì),并且研發(fā)出關(guān)鍵的 AI 數(shù)據(jù)引擎,。
但硬件方面也同樣重要,。如果我們真的想做出實(shí)現(xiàn)高性能、高可靠性,、高安全性和低成本的人形機(jī)器人,,就需要開(kāi)發(fā)自己的執(zhí)行器、電子設(shè)備,、電池和幾乎所有軟件,,因?yàn)檫@些都沒(méi)有現(xiàn)成的解決方案。做硬件我們經(jīng)常說(shuō)“唯一的出路就是繼續(xù)前進(jìn)”,,因?yàn)槊看螁?dòng)機(jī)器人都會(huì)出現(xiàn)各種新問(wèn)題,,這確實(shí)是一項(xiàng)嚴(yán)峻的挑戰(zhàn),。
長(zhǎng)時(shí)間從事軟件開(kāi)發(fā)再進(jìn)入硬件領(lǐng)域是真的很困難,研發(fā)硬件需要經(jīng)過(guò)一個(gè)漫長(zhǎng)的迭代周期,,這也是我們受挫的主要因素,。
Peter:LLM 如果能夠應(yīng)用于人形機(jī)器人,我們就可以與機(jī)器人交流,,讓它理解我的意圖,,進(jìn)行有效對(duì)話。你們打算訓(xùn)自己的模型,,還是會(huì)集成其他模型,?在你們制造機(jī)器人的哪個(gè)環(huán)節(jié)會(huì)引入 LLM?
Brett:要讓人形機(jī)器人從工廠走進(jìn)家庭,,關(guān)鍵在于語(yǔ)言,,所以 LLM 或視覺(jué)語(yǔ)言模型對(duì)我們的業(yè)務(wù)幫助很大。我們要讓機(jī)器人能夠從語(yǔ)義層面理解世界,,做到理解和回應(yīng)用戶的需求和指令,,恰好 LLM 可以做到這點(diǎn)。
因此,,我們會(huì)逐步將視覺(jué)語(yǔ)言模型加入機(jī)器人的研發(fā)過(guò)程,,從高層次的行為角度來(lái)幫助人形機(jī)器人理解人類在說(shuō)什么,讓它能與人類進(jìn)行對(duì)話,,同時(shí)也能推斷和理解人們?cè)谡f(shuō)什么以做出回應(yīng),。我們很可能不會(huì)自己訓(xùn)模型,但我們可以在機(jī)器人系統(tǒng)上訓(xùn)練視覺(jué)語(yǔ)言模型,,關(guān)聯(lián)傳感器數(shù)據(jù),。
打造一個(gè)正確的 AI 數(shù)據(jù)引擎對(duì)我們來(lái)說(shuō)非常重要,它能確保我們對(duì)機(jī)器人產(chǎn)生的數(shù)據(jù)進(jìn)行準(zhǔn)確的訓(xùn)練,,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行正確的訓(xùn)練,,以便未來(lái)能夠有效地部署和使用。這也是驅(qū)動(dòng)我們盡快讓產(chǎn)品進(jìn)入市場(chǎng)的動(dòng)力,,我們希望將更多的機(jī)器人投放市場(chǎng),,收集數(shù)據(jù),從而讓我們未來(lái)的機(jī)器人隊(duì)伍將變得更加智能,、學(xué)會(huì)更多技能,。
Peter:人們沒(méi)有意識(shí)到機(jī)器人之間的 AI 和數(shù)據(jù)集是相互連接的,當(dāng)一個(gè)機(jī)器人學(xué)會(huì)了如何執(zhí)行某項(xiàng)任務(wù),,或者如何應(yīng)對(duì)某種情況,,不僅僅是那個(gè)機(jī)器人學(xué)會(huì)了,所有的機(jī)器人都會(huì)學(xué)到,這個(gè)是很棒的,。
Brett:就像我的孩子們一樣,,在他們學(xué)習(xí)做某件事的過(guò)程中,盡管可能失敗了很多次,,但他們一旦掌握了就不會(huì)忘記,,然后他們會(huì)不斷積累新的技能。
對(duì)于機(jī)器人也是一樣的,,一旦我們成功地教會(huì)一個(gè)機(jī)器人如何成功地卸貨或處理特定情況下的箱子,,整個(gè)機(jī)器人隊(duì)伍都會(huì)學(xué)到這個(gè)技能,。因此,,機(jī)器人的性能提升將非常迅速和顯著,。
04.
機(jī)器人會(huì)取代人類就業(yè)嗎,?
Peter:你預(yù)計(jì)市場(chǎng)最早什么時(shí)候會(huì)看到 Figure 的第一個(gè)商業(yè)應(yīng)用?
Brett:我預(yù)計(jì)會(huì)在明年,,如果我們明年還做不到,,那可能會(huì)延后一兩年,,這是個(gè)比較理想的計(jì)劃,。我們會(huì)盡量多發(fā)布一些產(chǎn)品物料讓公眾了解我們的進(jìn)度并獲得市場(chǎng)支持,,這非常重要。我們計(jì)劃在未來(lái) 2-3 個(gè)月內(nèi)發(fā)布首個(gè)人形機(jī)器人在辦公室里行走的視頻,。未來(lái),,我們還將在感知、操縱和其他傳統(tǒng)操作領(lǐng)域做更多工作,。
Figure 01 動(dòng)態(tài)行走
Source: Figure.ai
我們發(fā)布視頻的目的不僅僅是讓機(jī)器人展示花哨的動(dòng)作,,而是展示它在重復(fù)性工作中的出色性能。我們會(huì)把機(jī)器人放在倉(cāng)庫(kù)里,,一遍又一遍地完成工作,,我認(rèn)為這才是具有突破性的進(jìn)展。
我們目前正與客戶合作,,看怎么讓 Figure 在我們的實(shí)驗(yàn)室中開(kāi)始工作,并盡量模擬客戶的工作環(huán)境,,這樣明年就可以更容易地將它部署到客戶的工作場(chǎng)景中,。
Peter:高盛的預(yù)測(cè)是,未來(lái) 15 年內(nèi),,機(jī)器人可能會(huì)創(chuàng)造 1540 億美元的收入,,你也提到過(guò)全球 GDP 的一半來(lái)自勞動(dòng)力,這是 Figure 的潛在市場(chǎng),。是否有人擔(dān)憂機(jī)器人尤其是人形機(jī)器人的出現(xiàn)會(huì)導(dǎo)致人們失去工作,,引發(fā)類似于 AI 引起的就業(yè)問(wèn)題?
Brett:我的觀點(diǎn)是在接下來(lái)的 10-20 年里,機(jī)器人業(yè)務(wù)的發(fā)展將與自動(dòng)駕駛汽車的發(fā)展路徑類似,。就像自動(dòng)駕駛汽車,,高速公路的測(cè)試視頻會(huì)比城市街道的更早公開(kāi),是因?yàn)槌鞘薪值烙懈叩陌踩蠛透嗟牟淮_定性,。
同樣,,人形機(jī)器人也會(huì)首先解決相對(duì)容易的問(wèn)題,比如在預(yù)知環(huán)境和任務(wù)的情況下搬運(yùn)貨物,。這類任務(wù)就像在高速公路上駕駛,,相對(duì)簡(jiǎn)單易行。然而,,更復(fù)雜的任務(wù),,例如在家中烹飪或照顧老年人,就像在城市街道上駕駛,,更具挑戰(zhàn)性,。
Source: Figure Master Plan
盡管大家對(duì)人形機(jī)器人的期望往往集中在復(fù)雜任務(wù)的解決上,比如谷歌的機(jī)器人做垃圾分類,,豐田研究院在雜貨店等場(chǎng)景的研究,,但這些都是非常困難的挑戰(zhàn)。我很高興有這些研究,,但從商業(yè)角度出發(fā),,我們的首要任務(wù)應(yīng)該是解決那些簡(jiǎn)單但必要的問(wèn)題,然后逐漸將 AI 數(shù)據(jù)引擎應(yīng)用到更復(fù)雜的任務(wù)中,。
所以 Figure 和其他研究團(tuán)隊(duì)關(guān)注的事情恰恰相反,。我們的目標(biāo)是在倉(cāng)儲(chǔ)制造領(lǐng)域應(yīng)用人形機(jī)器人,這個(gè)領(lǐng)域的勞動(dòng)力短缺問(wèn)題最為嚴(yán)重,。全球約一半的 GDP 來(lái)自勞動(dòng)力,,我們正在面對(duì)全球范圍內(nèi)的勞動(dòng)力短缺問(wèn)題。隨著嬰兒潮一代的退休和生育率的下降,,這個(gè)問(wèn)題將越來(lái)越嚴(yán)重,。
Peter:大家沒(méi)有意識(shí)到,我們面臨的最大挑戰(zhàn)不是人口過(guò)多,,而是人口不足,。
Brett:這必然會(huì)是一個(gè)重大問(wèn)題。我們有時(shí)候去拜訪客戶,,比如一個(gè)大型財(cái)富 100 強(qiáng)公司時(shí),,他們首先考慮的不是如何讓機(jī)器人與員工協(xié)同工作,而是讓機(jī)器人解決勞動(dòng)力短缺的問(wèn)題,。去年他們的倉(cāng)庫(kù)員工流失率高達(dá) 140%,,因?yàn)闆](méi)有人愿意做這些危險(xiǎn)且冬冷夏熱的工作。
Peter:未來(lái)幾年內(nèi),你是否會(huì)把所有機(jī)器人首先投入到倉(cāng)庫(kù)環(huán)境中,,讓它們從事包裝,、解包、貨運(yùn)和物流等工作,,并且著重去提升在這些場(chǎng)景下的能力,?
Brett:我們現(xiàn)在大部分時(shí)間都投入到了機(jī)器人在物流方面的應(yīng)用,也在一些大型汽車制造商(OEMs)上花費(fèi)了不少時(shí)間,,這些制造商的生產(chǎn)設(shè)施需要大量員工來(lái)操作,。上周我們?nèi)チ艘粋€(gè)美國(guó)著名 OEM 的廠房,那里有近 1 萬(wàn)名員工,。他們問(wèn)題很多,,人手不夠,很多工作都很危險(xiǎn),,工人在機(jī)器旁做點(diǎn)焊工作,,你都可以聞到焊接煙霧的味道。
在訂單履行和物流操作的領(lǐng)域內(nèi)也存在很多問(wèn)題,,因?yàn)樗鼈冃枰皶r(shí)進(jìn)行庫(kù)存管理,。我們看到每天大約有四、五百萬(wàn)個(gè)零件需要人工處理,,都集中在同一個(gè)設(shè)施或同一位置,,這個(gè)任務(wù)量是很龐大的,此外還有大量的鋼板被移動(dòng)到不同的機(jī)器上,,員工需要在數(shù)百個(gè)工作站做點(diǎn)焊這種重復(fù)工作,。
Peter:工廠是 7 × 24 無(wú)休,還是每天 8 小時(shí),?
Brett:不,,他們是每天運(yùn)作 21 至 22 個(gè)小時(shí),有兩個(gè) 10 小時(shí)的班次,。
Peter:所以這些機(jī)器人可以在沒(méi)有人員干預(yù)的情況下全天候工作,,不需要像人類員工一樣進(jìn)行藥物測(cè)試,也不需要提供假期和保險(xiǎn),。對(duì)于這種工種,,如果有一個(gè)良好的 PMF,機(jī)器人是非常理想的勞動(dòng)力,。
Peter:接下來(lái)你是否計(jì)劃進(jìn)軍物流、倉(cāng)儲(chǔ)和送貨服務(wù)領(lǐng)域,?你認(rèn)為下一個(gè)潛在的大市場(chǎng)是什么,,我們何時(shí)會(huì)看到這些人形機(jī)器人出現(xiàn)在這個(gè)領(lǐng)域?
Brett:我們計(jì)劃先在未來(lái)十幾年內(nèi)持續(xù)擴(kuò)大在商業(yè)勞動(dòng)力市場(chǎng)的規(guī)模。我們關(guān)注的領(lǐng)域包括醫(yī)療保健,、房地產(chǎn),、建筑和零售等,我相信這些領(lǐng)域都有巨大的市場(chǎng)潛力,。
另外,,還有一些市場(chǎng)尚未應(yīng)用人形機(jī)器人,比如房地產(chǎn),??萍挤康禺a(chǎn)公司開(kāi)發(fā)的在線平臺(tái)可以使用人形機(jī)器人來(lái)代替人類經(jīng)紀(jì)人提供服務(wù)。人們可以通過(guò)訪問(wèn)網(wǎng)站預(yù)約看房,,然后由人形機(jī)器人打開(kāi)門迎接他們,,在一個(gè)虛擬的房屋中全程介紹。這是一個(gè)價(jià)值數(shù)萬(wàn)億美元的市場(chǎng),,但科技公司迄今為止還未涉足,,因?yàn)槟壳胺康禺a(chǎn)領(lǐng)域的工作仍然過(guò)于依賴人力。
此外,,還有許多行業(yè)的工作可以通過(guò)遠(yuǎn)程操作或其他技術(shù)來(lái)完成,,人形機(jī)器人可以為這些行業(yè)帶來(lái)新的發(fā)展機(jī)會(huì)。
Peter:我個(gè)人很期待人形機(jī)器人進(jìn)入支持老齡人口的市場(chǎng),,這也是一個(gè)相對(duì)迫切需要補(bǔ)充勞動(dòng)力的市場(chǎng),。如果我們希望讓機(jī)器人為老年人提供高質(zhì)量的看護(hù)服務(wù),需要哪些技術(shù)上的突破和創(chuàng)新,?
Brett:這需要我們的人形機(jī)器人具備足夠的可靠性,、安全性以及合理的成本。從硬件的角度來(lái)看,,這種機(jī)器人將能夠執(zhí)行在家庭環(huán)境中所需的幾乎所有工作,。在商業(yè)市場(chǎng)上,我們需要建立對(duì)產(chǎn)品的信任和其他方面的成熟度,。
通過(guò)將人形機(jī)器人應(yīng)用于擁有大量勞動(dòng)力的大型企業(yè)中,,提高機(jī)器人的智能性、靈活性,、可靠性,,最終進(jìn)行大規(guī)模生產(chǎn)以降低成本。機(jī)器人在老年護(hù)理領(lǐng)域的應(yīng)用將在大約十年后發(fā)生,,并且非常重要,,甚至可能創(chuàng)造更大的市場(chǎng)。但這只是我們計(jì)劃的第二步,,而第一步是商業(yè)市場(chǎng),。
Peter:當(dāng) Figure 發(fā)展到第 5,、6、7 代的時(shí)候,,是否會(huì)出現(xiàn)一個(gè)擁有面部特征和個(gè)性的人形機(jī)器人,,從而增加用戶的舒適感?有面部表情的機(jī)器人可以讓人感覺(jué)到它們與你建立了連接,。隨著 AI 朝著 AGI 的方向發(fā)展,,識(shí)別用戶的情感狀態(tài)并傳達(dá)情感回應(yīng)的能力將會(huì)變得越來(lái)越重要。你對(duì)此有什么看法,?
Brett:我們完全可以做到這一點(diǎn),。我們的機(jī)器人頭部今天已經(jīng)有了一個(gè)全封閉的屏幕,可以傳遞信息,,告訴用戶機(jī)器人正在做什么,,還可以提供提示等等。我們?cè)陬^部還配備了攝像頭和各種傳感器,。無(wú)論我們的機(jī)器人是照顧者還是在為企業(yè)提供服務(wù),,都可以向用戶傳遞面部表情信息,以使他們感到舒適,。
Figure 01 頭部可傳遞信息的全封閉屏幕
Source: Figure.ai
現(xiàn)在 NLP 已經(jīng)足夠成熟,,可以讓機(jī)器人與用戶進(jìn)行對(duì)話性的交流。我們也可以讓機(jī)器人的外觀看起來(lái)更舒適,??紤]到我們的業(yè)務(wù)還處于早期階段,我們需要花費(fèi)很多時(shí)間來(lái)實(shí)現(xiàn),。如果可以,,我們一定會(huì)向消費(fèi)者提供這樣的體驗(yàn)。
Peter:我們聊了工業(yè)物流,、制造業(yè)還有醫(yī)療保健,,你最期待的下一個(gè)重要市場(chǎng)是什么?
Brett:我真的很愿意在消費(fèi)者領(lǐng)域,、家庭領(lǐng)域和照顧老年人方面提供幫助,。長(zhǎng)期而言,這些是非常重要的業(yè)務(wù),,每個(gè)人都會(huì)擁有一個(gè)人形機(jī)器人作為助手來(lái)做事情,。而另一個(gè)并沒(méi)有得到很多關(guān)注的市場(chǎng)是,我認(rèn)為人形機(jī)器人將會(huì)被應(yīng)用于宇宙探索,。
Peter:你提到了我要說(shuō)的領(lǐng)域,,太空探索。
Brett:我們正處在太空探索的黃金時(shí)代,,這讓我感到非常興奮,。這是由于正在建設(shè)的基礎(chǔ)設(shè)施為火箭發(fā)射提供了支持,。我認(rèn)為人形機(jī)器人將是一個(gè)對(duì)人類非常有幫助的工具,可以幫助我們?cè)谠虑蚝突鹦堑鹊亟⒕幼〉亍?/p>
轉(zhuǎn)載請(qǐng)注明來(lái)自浙江中液機(jī)械設(shè)備有限公司 ,,本文標(biāo)題:《Figure:為人類部署數(shù)十億臺(tái)人形機(jī)器人》
還沒(méi)有評(píng)論,,來(lái)說(shuō)兩句吧...