應用

技術

物聯網世界 >> 物聯網新聞 >> 物聯網熱點新聞
企業注冊個人注冊登錄

特斯拉的 2020 年自動駕駛大餐

2019-11-08 09:08 汽車之心

導讀:特斯拉 CEO Elon Musk 夸下海口:2020 年實現全自動駕駛。這可能不太容易實現,但 Musk 并不是毫無根據的吹牛。從 DeepMind 的 AI 在《星際爭霸》上吊打人類選手,我們也能透視出些許端倪。

與其他駕駛公司不同,特斯拉售出的所有車都是數據收割機,能夠形成大體量的數據集。特斯拉采用模仿學習的機器學習技術,且認為在提供足夠多的數據的情況下自己能夠成功訓練出表現出色的自動駕駛技術。特斯拉正在通過一系列工作搭建自身的訓練流程,它在自動駕駛上的發展手段有可能會在某時間點實現瞬間的技術突破從而給汽車行業的發展帶來顛覆性影響。

2018 年 11 月,國外科技媒體 The Information 曝料,稱特斯拉使用的是名為「模仿學習」(imitation learning)的機器學習技術:

「與其他自動駕駛公司不同,特斯拉售出的所有車都是數據收割機,即使 Autopilot 處于關閉狀態,車輛傳感器也能照常工作。

因此,Autopilot 團隊手中有用不完的數據,他們能從中發現人類駕駛員在不同場景下的駕駛方式,并對其進行模仿。

在取其精華,去其糟粕后,這部分信息就成了車輛在特定場景下行駛的輔助附加因素,它們能教會車輛如何轉彎或躲避障礙物。」

The Information 在文中轉述了那些模仿學習「信徒」的理念:特斯拉工程師相信,只要給神經網絡灌入足夠多的駕駛數據,就能讓 Autopilot 學會大多數情況下的轉向、剎車和加速操控。

他們甚至認為,未來連代碼都不用寫了,在特定場景下,自動駕駛系統就知道該怎么做。

這些工程師并不是盲目樂觀,因為他們提出這些觀點幾個月后,谷歌旗下的 DeepMind 就用模仿學習讓 AI 成了《星際爭霸》頂級高手。

而在此前,這款游戲是 AI「修仙」路上的一座高峰。

就連 Google Brain(谷歌 X 實驗室重要項目)機器學習工程師 Alex Irpan 都為此感到吃驚:

「我們一直覺得這種長期任務是模仿學習的死穴,此前我甚至認為它根本玩不轉《星際爭霸》,誰知道結果如此出人意料。我們的擔憂在于,如果 AI 犯了錯,它會發現自己處于沒有人類習慣可模仿的尷尬境地。」

Irpan 推測認為,只要數據量夠了,DeepMind 的 AI 就能成功跨過這個坎:

「如果你的數據集非常大,囊括了不同級別的技巧,比如將所有玩過《星際爭霸》的玩家操作都記錄在內,那么你的數據就足夠讓 AI 學會如何在作出錯誤判斷后成功翻盤了。」

在今年 4 月特斯拉的 Autonomy Day 發布會上,特斯拉 AI 主管 Andrej Karpathy 親口證實了模仿學習的存在。

事實上,他還透露稱,模仿學習已經在一定程度上用到了量產版的 Autopilot 上。

Karpathy 還堅信,當下靠手工編碼的任務,未來靠模仿學習會更加出色。

顯然,如果一切順利,特斯拉也能像 DeepMind 一樣在自動駕駛行業橫掃一切。

更重要的是,業內根本沒有什么競爭對手。

因為除了特斯拉,誰也沒有 60 萬輛在路上勤勞采集數據的車輛,而這些車輛每天在各種路況下能累積 2000 萬英里的行駛里程。

即使強如 Waymo,手上也沒有如此體量的數據集,因為 Waymo 的測試車保有量只有特斯拉車隊的 0.1%。

怎樣拿到真正有價值的數據?

雖然能采集數據的車輛眾多,但想從這些隨機上傳的數據中找到有用的部分并不容易。因此,特斯拉需要找到捕捉各種不同駕駛習慣的新方式。

對大多數公司來說,手動采集是最直接的方式。

特斯拉工程師可以在系統中植入上傳觸發器,只要某些數據符合要求,就會自動保存并上傳,比如無保護左轉。

他們也確實這么做了:當車輛的視覺神經網絡探測到了交通信號燈,或駕駛員向左打了方向盤,車輛就會記錄下這個片段,隨后通過 Wi-Fi 回傳。

不過,那些工程師們想不到的行為怎么辦?如果神經網絡犯了錯誤怎么辦?

在這樣的情況下,Autopilot 的介入是最理想的觸發器。Musk 表示,特斯拉的方法是「將這一切看作錯誤的輸入」。

如果 Autopilot 的介入被視為錯誤,那么隨后人類駕駛員的動作就是正確行為最好的示范。

這樣一來,Autopilot 的介入就能持續提供有用的訓練數據了。

當然,在駕駛員操作模式下我們也能采集訓練數據。為此,特斯拉專門設計了一個「影子模式」。

The Information 在文章中對其進行了一番描述:

業內也有不少評價,認為特斯拉所謂「影子模式」對新 Autopilot 軟件的開發價值不大,畢竟特斯拉本來就能在不影響車輛行駛的情況下運行各種測試軟件。

Autopilot 的工程師完全可以拿測試軟件的表現與車輛實際表現進行對比。在「影子模式」下,Autopilot 團隊則能對人類與 Autopilot 在相同場景下的反應進行對比。

用模仿學習訓練的神經網絡可以在車載計算機上被動運行,同時輸出它眼中的最佳選擇。如果人類駕駛員有不同反應,就能觸發這個片段的數據上傳。

一旦出現「意見相左」,神經網絡的抉擇就會被判錯,而駕駛員的操作則成為正確示范。

除了在人與計算機意見相左時保存數據,特斯拉還能在神經網絡「懷疑」自己時保存數據。

當下,市場上已經有了不少試圖量化神經網絡不確定性的技術,當這個數值超過某個閥值,就會觸發數據的保存和上傳。

因此,從廣義上來講,特斯拉共有三種采集有價值數據的方法:

手動設定觸發器;

Autopilot 介入;

被動運行的神經網絡,如「影子模式」。

鑒于特斯拉的硬盤每天都能接收 2000 萬英里數據,因此想采集大型數據集(包括不同的駕駛習慣和糾錯示范)并不難。

不過,對 Waymo 這樣兩年才跑 2000 萬英里的公司來說,這種方案不太實際了。

如果 DeepMind 手上只有數百個玩家的數據,它的 AI 還能制霸《星際爭霸》嗎?

恐怕沒有希望。

這并不是小看他們,現實是當下的神經網絡對數據的胃口實在是太大了。

對人來說,一個小時內學會玩《星際爭霸》并非難事,但想在同樣時間內訓練出同樣水平的神經網絡,就得有數百萬甚至上億個千變萬化的例子打基礎。

同樣的,即使神經網絡能從龐大的駕駛數據中學到一些駕駛的精髓,想與人類媲美也得將錯誤率拉低到 0.1% 以下。

鑒于邊際效益會隨著數據的增多而遞減,因此,只有真正海量的數據庫才能解決問題。

不過,海量的數據庫不是我們想搭就能搭起來的。舉例來說,如果我們想要 1 萬個極端情況的示例,前提是得累計 100 億英里的行駛里程。

對特斯拉來說,是有希望實現的。因為隨著新車的持續交付,未來 17 個月就能搞定 100 億英里。

而 Waymo 現在的車隊規模,實現這一目標得 800 年。

這就是特斯拉的自動駕駛解決之道:

對那些無法人工編碼的駕駛任務進行模仿學習,配合計算視覺與行為預測的深度學習,以及那個無所不包的海量數據集。

一日千里的進步切合實際嗎?

Musk 相信,特斯拉將在 2020 年底解決全自動駕駛問題。不過,業界普遍認為 Musk 定的時間點有些激進。

在他們看來,自動駕駛技術的開發是人工處理的過程。

按照這種理解,開發自動駕駛軟件需要工程師不斷對代碼進行修改,因此人的速度就是天花板,即使添加更多工程師也快不了多少。

但現在還是這種思路嗎?

DeepMind 為了攻克《星際爭霸》,花了三年時間研究。不過,用上了模仿學習后,將 AI 訓練到人類級別只用了三天。

為什么能這么快?

因為訓練流程已經能自己寫出《星際爭霸》的對戰代碼,而前三年人類的工作主要是為了標定這個訓練流程,特別是神經網絡架構和數據集。

火箭工程師們走的也是這個路子,火箭前期的設計與建造會花費他們大量時間,幾年之內甚至一點成功都見不到。

不過,當萬事俱備,十秒鐘的倒計時后就能見證奇跡。從時間的維度看,前幾年毫無作為,最后幾秒突然爆發。

事實上,研究和工程的進展都被隱藏在了幕后。

顯然,現在的特斯拉正在通過一系列工作搭建自己的訓練流程。

舉例來說,特斯拉全新的計算硬件還沒火力全開,為新硬件設計的神經網絡也還在開發與測試中,他們正在為未來積聚力量。

至于今年 4 月展示的那版全自動駕駛軟件,據說只是三個月神經網絡訓練的結果,軟件開發對應的場景也相當單一。

而就在一年之前,特斯拉才剛剛掌握高速上的車道保持功能,當時特斯拉還推了一個 OTA 升級包修復了車輛在車道線間反復搖擺的漏洞。

Karpathy 指出,那次的升級,特斯拉「重寫了很多東西」。從那時起,Karpathy 的團隊和 Autopilot 部門的其他技術專家們一直在為 Autopilot 打地基,特別是計算視覺。

如果特斯拉不推送升級包,公眾就看不到他們努力的結果。

至于一些城市駕駛功能是否適合部署,則純粹是二進制而非增量問題,最終一切都得由特斯拉來決斷,外部是根本看不到其中的漸進發展過程的。

自動駕駛經濟模型

全自動駕駛汽車,不但能徹底顛覆 Uber、滴滴、Lyft 與傳統出租車公司苦心建造的王朝,還能讓傳統的私人擁車制分崩離析。

美國汽車協會的數據顯示,購買并使用一輛新車,每英里平均要花掉 0.62 美元。而投資機構 ARK 預計,自動駕駛出租車的生產與運營成本僅為 0.26 美元/英里。

如果套用 ARK 的經濟模型:

「只要自動駕駛出租車公司將價格定在 0.45 美元/英里,比小型轎車稍低(擁車成本為 0.47 美元/英里),那么自動駕駛出租車每英里依然能盈利 0.19 美元。

假設一輛車每年運營 12.7 萬英里(幾乎是當下傳統出租車運營里程的 1.8 倍),每英里收費 0.45 美元,一年利潤就有 2.62 萬美元。

如果有 100 萬輛這樣的自動駕駛出租車,就意味著能每年凈賺 262 億美元。」

但別被 100 萬輛車嚇住了,這個數量級的出租車根本不夠用:

假設用戶的出行需求維持在當下的水平,每輛自動駕駛出租車就能代替 8-9 輛常規汽車(平均每年行駛 1.35 萬英里)。鑒于全球常規乘用車保有量約為 10 億輛,因此自動駕駛出租車必須有 1.1 億-1.25 億輛才夠用。

所以,自動駕駛行業的成長空間還很大。

不過,ARK 投資的模型中有些假設需要進行調整。

比如它將自動駕駛出租車的造價定在了 5 萬美元一輛,這可比現在最便宜的 Model 3(3.9 萬美元)要貴上不少。

即使 Model 3 毛利只有 5%,也能從造價中再減掉 2000 美元。對特斯拉 Network 來說,這才是更合理的數字。

對自動駕駛出租車年運營里程的假設,它應該和 Uber 與傳統出租車差不多,即一年 7 萬英里。

需要注意的是,即使是自動駕駛汽車,也會有空駛時間。

按 Uber 的水平看,車上有乘客的時間占到車輛運營總時間的 64%。

也就是說,每年單輛車凈利潤 4200 美元才更合理,100 萬輛自動駕駛出租車則能凈賺 42 億美元。

當然,毛利與價格是緊密掛鉤的,而 0.45 美元/英里的定價已經相當低廉。如前所述,私家乘用車平均每英里要的價格是 0.62 美元。

如果打車費用定在 0.6 美元/英里,相同的特斯拉車型每年能凈賺 1.08 萬美元。

無論怎么計算,自動駕駛出租車都會成為成本大殺器:

首先,這些車輛的性質意味著它們的成本會分攤到很多乘客身上。

其次,自動駕駛汽車不需要司機。

另外,我們還得關注車輛壽命。

一輛傳統燃油車,20 萬英里后的維保成本會迅速攀高。電動車在這方面有優勢,比如當下特斯拉電池組使用 50 萬英里沒有問題。

這也就意味著,普通用戶得駕駛 37 年才能耗盡特斯拉電池組的壽命。而 100 萬英里使用壽命的特斯拉新車也正在開發中。

簡言之,自動駕駛出租車能解鎖電動車潛在的有形資產:電動車的電池組壽命不會輕易被浪費。

不過,自動駕駛出租車和電動汽車之間的協同作用在最初可能并不明顯。在這樣的情況下,只要延長車輛壽命周期,才能轉化為相當可觀的經濟價值。

如果電池和電動機的提升和改進,能為電動車增加 20 萬英里的壽命,在經濟上就相當于讓一輛車變兩輛車。

這對汽車廠商來說,少賣車等于是革了他們的命。從消費者角度考慮,一輛車開上 30 年恐怕也會是一個噩夢,畢竟在這么長時間的跨度里,汽車在各項功能上都會有脫胎換骨的提升。

但對自動駕駛汽車來說,這根本不是問題。這也是華爾街巨鱷們(麥肯錫、瑞銀、摩根斯坦利等)普遍長期看好自動駕駛出租車的原因,其市場規模將達數千億甚至上萬億美元。

如果自動駕駛汽車真能如約部署,不但會讓司機們丟了飯碗,還會逐步吞掉整個汽車行業。

不過,即使到了現在,也有人懷疑這項技術的可行性:特別是近期和中期深度學習能否與人類的視覺、行為預測和駕駛能力所匹敵。

這個問題目前誰也回答不了,但我們依然能從這個趨勢中看出一些端倪:

首先,如果深度學習能在近期和中期解決這些問題,特斯拉將成為自動駕駛技術的正名人。

其次,如果特斯拉實現了全自動駕駛,從外人的眼光來看,特斯拉像開了外掛一樣,佛擋殺佛。

總之,特斯拉在自動駕駛上的新「套路」讓我們重新認識了技術進步。

前期的緩慢開發并不意味著后續的拖沓,一個花費數年時間搭建的神經網絡可能在幾天內就能完成訓練。而自動駕駛,有可能僅需一個 OTA 的時間,就如期而至了


公式规律七尾