亚洲精品中文免费|亚洲日韩中文字幕制服|久久精品亚洲免费|一本之道久久免费

      
      

            <dl id="hur0q"><div id="hur0q"></div></dl>

                特斯拉 AI-Day 觀后感

                馬斯克:我要搶答!

                注:內(nèi)容較長,閱讀可能需要毅力,請酌情安排時間。多是個人見解,有不對的大家批評指正。

                前言

                我把結(jié)論先放在前面,以便節(jié)約您的時間。這次 AI-Day 都說了哪些內(nèi)容?

                從時間角度:過去部分主要介紹了算法架構(gòu)、基于向量的融合式算法創(chuàng)新、決策系統(tǒng)算法優(yōu)化、標(biāo)注數(shù)據(jù)和模擬系統(tǒng)這四塊內(nèi)容,未來部分由 Dojo AI 加速芯片及擎天柱“人形特斯拉汽車”兩部分構(gòu)成。

                過去部分我個人的感受是:強大的工程能力和基于向量融合算法各個部分的系統(tǒng)整合能力,讓我覺得特斯拉技術(shù)團隊的算法創(chuàng)新可能不如 DeepMind,但工程能力方面,說他們第二可能沒幾個團隊敢稱第一。

                幾乎所有業(yè)界流行的模型算法和光線追蹤等新技術(shù),在他們手上都變成了可塑性極強的橡皮泥。其次,未來押寶在自研的算法芯片的領(lǐng)先性,以及擎天柱機器人對人類勞動力的替代。前者是內(nèi)涵的增強,進(jìn)一步加強核心競爭力和護城河。后者是外延的增強,把算力和自動化控制技術(shù)儲備、地理空間理解能力等,通過擎天柱機器人輸送到更通用的應(yīng)用領(lǐng)域,即:出行=>所有人類活動的人機協(xié)同場景。

                無論這種人機協(xié)同是實時的,如陪你一起整理房間,還是非實時的,如代替你去客戶家進(jìn)行汽車檢修,這種協(xié)同能力和用戶進(jìn)行深度耦合后,就賦予了人類如火影忍者版的影分身之術(shù)!下面,我們結(jié)合觀看 AI-Day 保存的截圖,依視頻的順序和內(nèi)容結(jié)構(gòu),以:內(nèi)容、觀察、思考、啟發(fā)的結(jié)構(gòu),分享一下自己的些許愚見。

                結(jié)構(gòu)

                識別:Linux 的萬物皆 Stream 到 特斯拉萬物皆 Vector

                決策:真實的體驗、真實的駕駛、真實的局部最小泥潭

                標(biāo)注:機器識別和人類理解的完美結(jié)合

                仿真:真實保下限自由突上限

                計算加速:夸張的 I/O 垂直供電和散熱的模塊化硬件加速芯片群

                擎天柱:站起來用腳走路還長了手的 Model S

                結(jié)語:腳踏實地仰望星空

                識別

                內(nèi)容:

                觀察:

              1. 虛擬相機融合多相機數(shù)據(jù);
              2. 2、 物理運動學(xué)知識嵌入算法模型;

                3、 特征堆棧優(yōu)化記憶平衡性能;

                4、 多模型、多模態(tài)融合下空間理解的上帝視角。

                思考:

                1、虛擬相機融合多相機數(shù)據(jù);

                之前搞過雙目視覺和 PointCloud 3D SLAM,但是,從特斯拉基于攝像頭的自動駕駛技術(shù)問世,我從沒想過把這兩個領(lǐng)域結(jié)合起來。其實,回頭看這兩個技術(shù)的結(jié)合是非常自然的,畢竟 SLAM 源于 ROS 機器人操作系統(tǒng)的興起,彼時對空間理解的迫切需求,至今仍在掃地機器人、穿越機等領(lǐng)域長盛不衰。

                2、物理運動學(xué)知識嵌入算法模型;

                知識嵌入算法模型近期很火。在不斷以 SOTA 攻克自然語言、圖像、自動化、化學(xué)、醫(yī)藥等領(lǐng)域 AI 高歌猛進(jìn)的時代,我經(jīng)歷了從皮爾遜相關(guān)度和歐幾里得距離的協(xié)同推薦,到支持向量機、多層感知器、端到端的深度神經(jīng)網(wǎng)絡(luò)、QLearn強化學(xué)習(xí)、DeepQLearn深度強化學(xué)習(xí)、卷積、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)、注意力機制等,再到神經(jīng)網(wǎng)絡(luò)架構(gòu)的靜態(tài)圖計算、動態(tài)圖計算、量子計算等,AI 領(lǐng)域也在隨之發(fā)生著微妙的變化。

                知識嵌入正是這些變化中,近一段時間出現(xiàn)在頂會論文里較多的。知識嵌入我個人理解最大的好處是在于可解釋性、可控性提升。所謂可解釋性提升,是指知識嵌入能夠?qū)⒃居缮窠?jīng)網(wǎng)絡(luò)擬合的各種參數(shù),部分被嵌入的知識所約束,從而將擬合、優(yōu)化的方向限定在先驗知識的約束內(nèi)。所謂可控性提升,是指知識嵌入對神經(jīng)網(wǎng)絡(luò)擬合的約束范圍調(diào)控,事實上在控制模型的精度。類似知識嵌入的頻繁提及和應(yīng)用,昭示了 AI 的算法模型、框架乃至硬件加速電子電路等,都在朝著更精細(xì)化、工程化和實用化的方向悄然變化。

                #Google 量子計算框架Cirq示例# https://quantumai.google/cirqimport cirq# Pick a qubit.qubit = cirq.GridQubit(0, 0)# Create a circuitcircuit = cirq.Circuit(cirq.X(qubit)**0.5,# Square root of NOT.cirq.measure(qubit, key=’m’)# Measurement.)print(“Circuit:”)print(circuit)# Simulate the circuit several times.simulator = cirq.Simulator()result = simulator.run(circuit, repetitions=20)print(“Results:”)print(result)

                3、特征堆棧優(yōu)化記憶平衡性能;

                堆棧其實沒什么,但為什么是27ms壓棧一次呢?我相信這背后有大量的測試、驗證和優(yōu)化。其實,如果把自己帶入到駕駛場景,記住周圍環(huán)境并在駕駛中不斷調(diào)整自己的預(yù)測,已經(jīng)是老司機的下意識反應(yīng)了。而算法工程師和軟件工程師們,常常割裂、技術(shù)的定義和解決問題,往往容易忽視這些身邊顯而易見、樸素的事實。

                我認(rèn)為讓模型替代人在駕駛等場景思考,首先要讓模型像這些專業(yè)人士一樣進(jìn)行專業(yè)的思考。比如,我們在 imgcook.com 的 D2C 設(shè)計稿生成代碼能力研發(fā)中,浙江大學(xué)的老師和同學(xué)并不懂前端,在定義和解決問題的時候往往是從學(xué)術(shù)和技術(shù)的角度孤立視角下解決問題,效果往往不盡如人意。但因為他們是專家,又很難深刻理解我的一些建議。在應(yīng)用 AI 和機器學(xué)習(xí)技術(shù)的時候,我認(rèn)為前提是對應(yīng)用對象領(lǐng)域的深刻思考,這些深刻思考才能定義出真正的、專業(yè)的問題,并讓算法模型像專家一樣思考。

                4、多模型、多模態(tài)融合下空間理解的上帝視角。

                其實,我們已經(jīng)漸漸變成了超人,當(dāng)然,不是內(nèi)褲外穿、披著斗篷、眼睛射激光的那種,而是千里眼、順風(fēng)耳、萬事通等。只要打開視頻通話,我就可以和遠(yuǎn)在深圳的老婆孩子處于同一個數(shù)字空間,彼此能夠聽見、看見。最近,臉書收購了一家提供觸覺仿真的公司,可能不遠(yuǎn)的將來我還能在數(shù)字空間里品評一下老婆買的裙子料子不錯。信息從互聯(lián)網(wǎng)時代開始,在 Web 2.0 繁榮,到如今的過載??梢哉f,只要你愿意花點兒時間,總是能夠獲取到萬事萬物的信息。前陣子在 B 站上,學(xué)習(xí)了大連理工大學(xué)方老師的《現(xiàn)代顯微成像技術(shù)》,讓我知道了:傅里葉變換除了理解信號時域和頻域變化外,還能夠理解信息在空間里的概率分布,如單光子成像的空間信息分布等。萬事萬物和我之間已經(jīng)沒有距離,只要我們同在數(shù)字空間里,或許這就是世界對元宇宙的期待之根源吧。

                我依稀記得當(dāng)年玩極品飛車,我還是喜歡第三人稱視角而不是主視角。主視角帶來的是沉浸感,讓玩家覺得投入和刺激。第三人稱視角則接近于上帝視角,讓我能夠更好地判斷周圍的環(huán)境,從而提前選擇入彎的時機和角度。而我從沒想到,特斯拉竟然幫我實現(xiàn)了在現(xiàn)實生活中獲得這種超能力的夢想,我的技能樹又點上了一個有趣的分支。

                啟發(fā):

                首先,萬物皆 Stream 一樣用 Vector 把不同的特征、算法模型聯(lián)系起來,系統(tǒng)化解決問題是對我的啟發(fā)。雖然,之前對 Ada Net 的 SubNet Search、AutoML、聯(lián)邦學(xué)習(xí)等技術(shù)有過研究,但特斯拉的做法更實際、更貼近問題和場景,而不僅僅是在純技術(shù)層面考慮問題。

                其次,當(dāng)我把《我是個怪圈》、羅素悖論、哥德爾不完備定理、集合論和自然數(shù)論的危機聯(lián)系在一起,再想想特斯拉的很多做法,讓我愈發(fā)對“內(nèi)觀俯察”篤定不已。一切都在于“自指向性”帶來的強大破壞力和強大創(chuàng)造力??赡芤驗槌砷L歷程坎坷,自幼就習(xí)慣于在自己身上找問題、改變自己適應(yīng)環(huán)境以生存下去。但是,觀察四周真正理解自指向性、內(nèi)觀俯察的技術(shù)人不常有,有則皆是我學(xué)習(xí)的榜樣。就像特斯拉,并沒有沉浸在海量數(shù)據(jù)和 ShadowSystem 帶來的巨大成就,而是進(jìn)一步下沉貼近駕駛者和駕駛場景,去解決駕乘本身和車與環(huán)境的問題。我在這方面做得還遠(yuǎn)遠(yuǎn)不夠,技術(shù)慣性和技術(shù)偏執(zhí)還時常如迷霧縈繞。

                最后,突破人的慣性思維。今天,不論是內(nèi)涵還是外延“人”已經(jīng)不再是簡簡單單的雙足直立行走會使用工具等定義了。但是,不可否認(rèn)的是作為靈長類動物我與生俱來的優(yōu)越感和慣性,限制了我的思想?!吧系垡暯恰焙唵蔚乃膫€字,其實突破了對人的認(rèn)知和慣性,上帝、外星人可能就是未來的人類而已,就像無數(shù)科幻小說中的構(gòu)想成為現(xiàn)實,蜥蜴人可能并不是老高說的藏在地底的外星人,而是未來某些人類希望外表更酷做的基因改造或換裝、Avatar 而已。因此,這種視角下重新看待手上的業(yè)務(wù),我能否用技術(shù)讓淘寶變成用戶手里的阿拉丁神燈,摸一摸就能變出自己想要的東西?雖然是個比喻,但超出用戶預(yù)期才是真的體驗創(chuàng)新,而實現(xiàn)它的技術(shù)就是護城河與核心競爭力。下面,來看看特斯拉在路線規(guī)劃的決策中如何進(jìn)行體驗創(chuàng)新的。

                決策

                內(nèi)容:

                觀察:

                1、多目標(biāo)優(yōu)化控制的駕駛平滑性;

                2、“實用的自動駕駛”實現(xiàn)智能會車;

                3、導(dǎo)航能力協(xié)同解決局部最小值問題。

                思考:

                1、多目標(biāo)優(yōu)化控制的駕駛平滑性;

                安全性、舒適性和轉(zhuǎn)彎便利性多目標(biāo)優(yōu)化控制下的平滑駕駛,蘊含了豐富的科技人文思考。加速會帶來推背感,爽!加速轉(zhuǎn)彎呢?剎車呢?不爽!可是,在城市擁塞的車流中,錯過變道的機會可能會更加不爽吧?當(dāng)然,安全還是要放到第一,爽著、爽著人沒了也不行。

                但是,我發(fā)現(xiàn)多目標(biāo)優(yōu)化控制其實是非常難的。比如,在芯片領(lǐng)域 PPA(Performance性能、Power功耗、Area尺寸)問題、在算法領(lǐng)域精度和泛化能力問題、搜索推薦的精度和重復(fù)、探索型匱乏之間的矛盾問題等等,只要稍微留意一下周圍,我就能發(fā)現(xiàn)眾多類似的問題。因為,簡單的問題都解決得七七八八,留給我們的都是復(fù)雜的、系統(tǒng)性的問題。

                說到系統(tǒng)性問題,就不得不提維納的《控制論》,如何把復(fù)雜系統(tǒng)符號化并進(jìn)行數(shù)學(xué)分析,理解系統(tǒng)的應(yīng)用對象、瞬態(tài)、穩(wěn)態(tài)、性能參數(shù)、穩(wěn)態(tài)誤差、PID 控制、根軌跡和勞斯-赫爾維茨公式判據(jù)法選取合適開環(huán)增益等等。還有現(xiàn)代控制論中:時域綜合方法里狀態(tài)反饋、輸出反饋、極點配置、觀測器、解耦控制、最優(yōu)控制等;頻域綜合方法里調(diào)節(jié)器超前、滯后、超滯后、Bode圖、Nichols圖、多項式矩陣綜合方法等。

                留心細(xì)看,我總能在特斯拉的工程實踐中找到這些理論和方法的影子,這是在一眾國內(nèi)自動駕駛公司的 PPT 和演講中看不到的,國內(nèi)公司看到的更多是跟隨、應(yīng)用、優(yōu)化,為什么?因為,技術(shù)變革初期和中期成功太容易了,真正沉下心“自指向性”的“內(nèi)觀俯察”搞研究的人,往往被認(rèn)作“不是瘋了就是傻了”,大家都撈錢去了。如今,從 Matlab、Sketch、EDA 等軟件再到芯片等硬件,被卡脖子的時候,很多大數(shù)據(jù)、新能源、智慧城市啥的赤裸著身子站在沙灘上茫然無措。反觀特斯拉的技術(shù)團隊,能夠從方案的思考和實現(xiàn)細(xì)節(jié)上尋得的蛛絲馬跡,無不透露出其對基礎(chǔ)知識和底層原理的重視,以及團隊扎實的功底。

                2、“實用的自動駕駛”實現(xiàn)智能會車;

                其實,看直播中的視頻畫面會更有體感,我簡單用文字描述一下:AutoPilot 先減速觀察對面企圖通行的轎車,發(fā)現(xiàn)轎車停下,立即毫不猶豫地開到其面前的右側(cè)空位讓其通過,然后自己并線后駛離。說真的,估計我這個開了十幾年車的老司機都沒 AutoPilot 這么果敢、流暢。這背后,我的感受是特斯拉對實用主義原則的堅持。不管是特斯拉的自動駕駛、超級工廠、SpaceX 的火箭回收、Boring 的 Hyperloop 還是最新的一體化房屋,無處不透露著實用主義,大部分都在解決資金、人力和時間成本問題。

                駕駛領(lǐng)域的基本問題就那么多,上過駕校且經(jīng)歷過筆試、路考的話大抵都門兒清??勺鲎詣玉{駛的團隊們大多買個激光雷達(dá)往車頂一裝,車上搞個車機跑個端到端的強化學(xué)習(xí)模型了事,然后就去忽悠投資人和老板。我很少聽自動駕駛技術(shù)團隊,站在駕駛場景里實實在在討論駕駛的問題,更多的是在宣傳自己的算法多牛逼、準(zhǔn)確率召回率有多高云云。

                3、導(dǎo)航能力協(xié)同解決局部最小值問題。

                這塊兒沒太多好說的,不能只見樹木不見森林,全局最優(yōu)和跨技術(shù)棧的協(xié)同良好解決了問題。

                啟發(fā):

                馬斯克說他眼中的“第一性原理思維模型”是:回溯事物本質(zhì),重新思考該怎么做。什么叫回溯事物本質(zhì),其實就是要對事物最基本要素進(jìn)行解構(gòu)。第一性原理就是建立在這種解構(gòu)基礎(chǔ)上,找到實現(xiàn)目標(biāo)最優(yōu)路徑的方法。此哲學(xué)觀點源于亞里士多德:“每個系統(tǒng)中存在一個最基本的命題,他不能被違背或刪除?!?/p>

                馬斯克對這個觀點的運用,在特斯拉電動車普及上,起到了關(guān)鍵作用。其時,馬斯克回溯阻礙電動車普及的問題,發(fā)現(xiàn)鋰電池價格昂貴影響大眾消費意愿,能量密度低影響續(xù)航。而這兩個實用的“最基本命題”,經(jīng)過馬斯克對電池原材料、制造工藝的解構(gòu),自建超級工廠研發(fā)制造不僅采購成本下降 30% 還自主可控的迭代能量密度。當(dāng)然,最新的電動車電機碳纖維套筒也是類似。只要稍微花點兒時間,我發(fā)現(xiàn)從發(fā)夾電極、定子永磁體封裝和排列、降溫油管道和位置、碳纖維套筒等等,特斯拉真的是在每個“最基本命題”上把實用主義和第一性原理發(fā)揮到極致。

                反觀自己,十年前 GDB 一行行查匯編指令去摳幾十 KB 內(nèi)存的精神今天已蕩然無存,每次開會討論的都是:能做還是不能做?你做還是我做?排期對不對得上?你改還是我改?哎……雖然我承認(rèn)有些事情不應(yīng)該用老眼光看待,或許應(yīng)用比底層更容易出成績,但是,Google 在為 C/C++ 推出繼任者 Carbon,The V Programming Language 都已經(jīng)出 Vinix 并且完成了 X.org 的支持,社區(qū)已經(jīng)完成了 Stable Diffusion 對 M1 芯片的支持,在蘋果 M1 芯片的筆記本上 15 秒就可以生成圖片。(用 M1 的小伙伴兒請看:https://www.toutiao.com/article/7138755607221748264/)在自己的領(lǐng)域內(nèi)產(chǎn)出一些真正有價值、實用且基本的技術(shù),將是 imgcook.com 的 D2C 需要思考的問題。

                標(biāo)注

                內(nèi)容:

                觀察:

                特斯拉標(biāo)注的不是數(shù)據(jù),是對多特征融合的理解,以此訓(xùn)練的 AutoPilot 在路上“全知全能”。

                思考:

                前文上帝視角是怎么產(chǎn)生的?創(chuàng)新的數(shù)據(jù)標(biāo)注功不可沒。比如,時空里一輛車駛過路口,路人或車輛被遮擋后特征和場景的時空關(guān)系發(fā)生了什么變化?如何理解這種變化對駕駛的影響并將其標(biāo)注出來?定義問題、用標(biāo)注數(shù)據(jù)描述問題、用模型解決問題被放在一起,還解決的很好,強!

                啟發(fā):

                忽的想起小時候,雄心壯志且信誓旦旦的把機械鬧鐘拆開發(fā)誓要修好,數(shù)十年后那些齒輪、機簧還在靜靜躺在抽屜里。我老臉一紅,想想特斯拉的天才工程師們,把這么復(fù)雜的系統(tǒng)有條不紊的協(xié)同在一起,共同的、實用的、深入且細(xì)致的解決一個個“基本命題”,不禁有些汗顏。近期在推動設(shè)計生產(chǎn)一體化解決業(yè)務(wù)需求迭代問題,我也想業(yè)務(wù)和產(chǎn)品能夠參與到產(chǎn)品研發(fā)中,一體化分析、定義、設(shè)計、約束、生成、發(fā)布、驗證、迭代產(chǎn)品的 UI、交互,讓用戶獲得更優(yōu)秀且個性化的信息表達(dá)從而提升瀏覽體驗。看到特斯拉的工作更加堅定了我的信心,畢竟到了深水區(qū),需要對產(chǎn)品和業(yè)務(wù)精雕細(xì)琢的時候了。

                仿真

                內(nèi)容:

                觀察:

                用光線追蹤提升模擬的實用性。

                思考:

                看到特斯拉的演示,回想起之前看過的自動駕駛技術(shù)分享,高下立判。撇開攝像頭和激光雷達(dá)之爭不談,單純從模擬技術(shù)來看就差了一大截。我從沒看到那個自動駕駛技術(shù)團隊分享時強調(diào)模擬的精確性,而且,這里精確性是從識別方案的第一性原理出發(fā)。如果說攝像頭的原理,就是感光元件捕獲光線這種特殊的電磁波產(chǎn)生電信號再 ADC 模數(shù)轉(zhuǎn)換后產(chǎn)生數(shù)字信號,這些數(shù)字信號就是我們所謂的圖像,因此,光線的真實性直接決定了這些數(shù)字信號的信噪比,信噪比決定了模型用這些信號訓(xùn)練的效果。

                然而,數(shù)字信號包含的信息量巨大,除了電子波頻率、電磁波強弱還有很多可分辨的信息,比如前文中說空間中光的信號傅里葉分析等,擁有巨大的改進(jìn)空間。而激光雷達(dá)的原理是什么?發(fā)出激光根據(jù)發(fā)射角度和反射回來的時延和角度來計算一個點的位置,從而得到精確位置信息,能夠直接采集點云 PointCloud 而不用視覺方案里復(fù)雜的校準(zhǔn)和計算,多簡單?但是,應(yīng)用的簡單背后其實是簡陋,很多人其實誤解了視覺方案的含金量。這就像拿 Kindle 的屏幕和 iPhone 的屏幕對比,高下立判、云泥之別。

                啟發(fā):

                在實現(xiàn)設(shè)計稿生成代碼的時候,模型訓(xùn)練中并沒有模擬能力。輸入的是設(shè)計稿,怎么能夠生成接近真實卻又能夠難到模型、啟發(fā)算法的設(shè)計稿?應(yīng)該是個不錯的思路。其實,再稍微延展一下,日常的自動化測試亦如此,怎么模擬用戶真實的環(huán)境?真實的操作?如何才能真實?如何將模擬的設(shè)計和軟件設(shè)計、程序設(shè)計、接口設(shè)計等聯(lián)系起來?才是真正有趣的事兒。

                計算加速

                內(nèi)容:

                觀察:

                1、OP 的電子電路化是 NPU 大趨勢;

                2、夸張的帶寬和創(chuàng)新的垂直供電冷卻系統(tǒng);

                3、易用性夸張到框架后端設(shè)置一下即可;

                4、任意縮放。

                思考:

                自從曠視科技和商湯讓攝像頭可以磨皮開始,AI 對消費電子的滲透就已經(jīng)勢不可擋。從個人電腦的顯卡加速運算到ARM 的 Neon 指令集,再疊加云計算和最近的元宇宙,讓整個世界變成了算力黑洞。大體看兩大陣營:通用硬件加速和專用硬件加速,世界的奇妙輪回把 GPU 從 CPU 分化的路又走了一遍,只是,這次是在 Nvidia 在 Cuda 和 AMD 跟進(jìn)的 ROCM 為始,慢慢從 GPU 里分化出來。

                通用硬件加速的好處就是應(yīng)用廣泛,但勢必在性能上比專用硬件加速差,甚至在一些情況下可能還不如 DSP,這也是為何 Apple 的芯片保留 DSP 和一眾專用芯片的原因:更低功耗、更快速度。但是,在大多數(shù)情況下圖計算需要的硬件加速能力差異被上層機器學(xué)習(xí)框架所屏蔽了,因此才會有 JAX 和 TVM 等技術(shù),這也是標(biāo)準(zhǔn)的力量。特斯拉的 Dojo 受益于這些紅利,設(shè)計研發(fā)了自己的通用硬件加速芯片,料堆滿、帶寬拉滿、模塊化縮放,怎么看都像極了 Apple 的 M 系列自研處理器,M1、M1 Pro、M1 Max、M1 Ultra。從 iPad、MacBook Air、MacBook Pro 到 Mac Studio,特斯拉也是從擎天柱機器人、特斯拉汽車到超算中心,一套方案縮放應(yīng)用到不同場景。

                啟發(fā):

                首先,D2C 現(xiàn)在主要解決的是前臺業(yè)務(wù)問題,未來,是否可以模仿特斯拉芯片的一套方案縮放應(yīng)用到不同場景?比如在源碼頁面、搭建頁面、中后臺頁面、承接頁等,縮放 D2C 技術(shù)體系的能力,而不需要重新設(shè)計研發(fā)。

                其次,在廣州 UC 的時候就經(jīng)常和身邊的小伙伴兒們一起 YY,如何用光計算替代現(xiàn)有的電子電路。說白了從電子管到晶體管之后,濕法光刻和極紫外光也基本到頭了,這兩天看新聞上各芯片制造企業(yè)都在探索光計算領(lǐng)域。如果未來有機會做芯片的話,我一定會嘗試一下物理計算,把我對計算本質(zhì)的理解和對物理的理解融合起來做點兒有意思的事情。喜歡下圖的小伙伴兒可以私信聊聊,:)。

                擎天柱

                內(nèi)容:

                觀察:

                那么,當(dāng)勞動力不短缺時會發(fā)生什么?當(dāng)程序員不加班時會發(fā)生什么?當(dāng)業(yè)務(wù)不再半夜匯報方案會發(fā)生什么?當(dāng)然是去玩兒啦!不然呢?小扎把臉書公司名字都改了,難道大家都瘋了?美國經(jīng)濟脫虛向虛難道那么多名校、智庫和學(xué)者都是傻子?一定有什么我不理解的東西存在,嗯!我估計是精神層面消費的崛起。

                思考:

                從 ROS 開始就對機器人技術(shù)很感興趣,之前做雙目視覺和 SLAM 就是從編譯 ROS 開始的。實時操作系統(tǒng)無論是設(shè)計還是實現(xiàn)上,都和我們所熟悉的操作系統(tǒng)有巨大差異,疊加上特斯拉汽車會穿梭于城市的安全性要求,可以想見特斯拉在實時操作系統(tǒng)領(lǐng)域的強大實力。而 AutoPilot 又賦予了實時操作系統(tǒng)以實時智能化能力,這就讓自動駕駛成為現(xiàn)實。而 AutoPilot 駕駛汽車還是駕駛一具人形機器,解決的“基本命題”是一致的。

                同時,用人形機器人替代人從事一些勞動,實用場景比掃地機器人、擦玻璃機器人等可廣泛太多了,很實用。全球勞動力人口約 34.5億(數(shù)據(jù)來源世界銀行:https://data.worldbank.org.cn/indicator/SL.TLF.TOTL.IN),馬斯克很可能借助擎天柱成為全球最大的勞務(wù)公司,用擎天柱進(jìn)行勞務(wù)輸出。

                如果工廠里用的是擎天柱機器人會怎么樣?7×24 不眠不休、不會罷工、成本大幅降低等等。哪怕工作內(nèi)容復(fù)雜,像美軍遠(yuǎn)程操作無人機一樣,雇個人在家里遠(yuǎn)程操作擎天柱完成勞動生產(chǎn),也會大幅度降低成本且改善工作環(huán)境,比如遠(yuǎn)程挖煤、遠(yuǎn)程保潔等。當(dāng)然,家庭環(huán)境端茶倒水、收拾房子、買菜做飯等,也能夠大幅度提升生活質(zhì)量。

                估計,未來可能會有公司買一些擎天柱去給人當(dāng)做飯阿姨,現(xiàn)在雇個阿姨每天做兩頓飯需要 5k 一個月,擎天柱 2k 一個月還是很有吸引力的。就像特斯拉股價大跌的 2016 年初我跟靜靜說我看好特斯拉一樣,如果擎天柱這事兒能像汽車一樣一步一個腳印,特斯拉的未來會更猛。除了行業(yè)機會,最重要的是特斯拉這群實用主義和第一性原理奉為神祇的工程師。當(dāng)然,馬斯克作為一個專業(yè)的老板,也很重要。這次 AI-Day 上馬斯克一如既往地?fù)尨?,但專業(yè)的回答無不透著他對技術(shù)細(xì)節(jié)的理解和解構(gòu)能力。

                啟發(fā):

                如果地雷是最簡單的機器人,擎天柱是智能人形機器人,imgcook.com 就是設(shè)計稿生成代碼機器人。我覺得機器人只是個概念,就像客服機器人一樣,智能化軟件本質(zhì)上就是個數(shù)字機器人。那么,擎天柱是馬斯克在特斯拉之外找到的延伸領(lǐng)域,imgcook 設(shè)計稿生成代碼機器人的底層能力是否能找到一個全新的延伸領(lǐng)域?我打算好好琢磨琢磨。

                其實,我覺得擎天柱也是第一性原理的產(chǎn)物。如果把特斯拉解構(gòu)一下,電機、驅(qū)動、電池、電控、實時操作系統(tǒng)、智能體,這些都是特斯拉長期沉淀的能力,如果把他們放在人形機器人上,幾乎是可以不做任何修改平移的。因此,馬斯克和這群優(yōu)秀的工程師或許就是這樣得到靈感的吧?

                結(jié)語:腳踏實地仰望星空

                首先,腳踏實地容易理解,字里行間到處都透著實用主義。畢竟是工程師不是科研人員,做工程不同于學(xué)術(shù)研究,實用是基本要求。不論是基于特征向量構(gòu)建的復(fù)雜智能體,還是在決策智能的安全、體驗和效果多目標(biāo)優(yōu)化,以及在標(biāo)注、仿真等方面的務(wù)實創(chuàng)新,再到硬件加速芯片的垂直供電制冷和縮放,以及復(fù)用現(xiàn)有能力延伸到全新賽道替代人勞動。處處是創(chuàng)新,但處處都是在解決“基本命題”。

                其次,仰望星空。推廣清潔能源保護地球,探索宇宙殖民火星給人類創(chuàng)造兜底方案,用機器人替代人做低價值的勞動,每一件事都描繪了一幅宏偉的藍(lán)圖。為什么特斯拉有這么多優(yōu)秀的工程師?因為,他們真的在踐行這些藍(lán)圖,這份赤子之心能夠感染、吸引和凝聚世界最頂尖的人才。

                最后,小小的我也有大大的夢想,雖然我不能像喬布斯、馬斯克和特斯拉工程師們一樣優(yōu)秀,但是,我希望在自己的技術(shù)工程領(lǐng)域和業(yè)務(wù)場景中,效仿他們用實用主義和第一性原理,堅定的、務(wù)實的去做點兒有價值的事情。給自己加油!

                鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
                用戶投稿
                上一篇 2022年9月9日 15:35
                下一篇 2022年9月9日 15:35

                相關(guān)推薦

                聯(lián)系我們

                聯(lián)系郵箱:admin#wlmqw.com
                工作時間:周一至周五,10:30-18:30,節(jié)假日休息