工業(yè)自動化無處不在。如工廠中執(zhí)行精確自動化任務的機械臂,。大型倉庫中沿著預定的軌道行駛取送包裹的機器人。地下礦井中可以在沒有人工操作的情況下沿著預編程軌道行駛的,大型輪式裝載機等等,。
然而,許多行業(yè)仍然依賴人工操作員和勞動力,。這些行業(yè)通常處于高度非結構化和變化的環(huán)境中,,同時這些環(huán)境也是人工工作最危險的環(huán)境,如建筑,、樹木收割和采礦等,。
自動化和非自動化任務:與地下礦井中復雜的環(huán)境相比,工廠中的環(huán)境更加簡單有組織
精確的重要性
Algoryx在重型機械的全系統(tǒng)物理模擬方面有十多年的經(jīng)驗,。其核心產(chǎn)品AGX Dynamics是一個用于多體和多區(qū)域動力學數(shù)值模擬的SDK,。
為了幫助行業(yè)解決現(xiàn)實世界的問題,Algoryx已經(jīng)跨越了理想化的模型,,他們開發(fā)了既遵循物理基本原理又允許對復雜的現(xiàn)實世界進行建模,。例如,模型考慮了接縫,、彈塑性梁,、接縫極限、可斷裂接縫,、分段線性模型等方面的間隙,。
這些都是我們在現(xiàn)實中遇到的常見現(xiàn)象,如果沒有建模到正確的水平,,模擬將無法解決任何現(xiàn)實世界中的問題,。AGX Dynamics中的可變時間步進器使實時或更快地模擬這些非理想化模型的不連續(xù)(或非光滑)物理事件(如撞擊)成為可能。這是通過處理每個時間步長中的幾何和全局問題而實現(xiàn)的,,所以最終可以在無限長的模擬時間內產(chǎn)生穩(wěn)定的物理模擬效果,。結合Algoryx的快速直接求解器,可以以機器精度求解大型稀疏系統(tǒng),,這使得模擬而無需任何特殊處理大質量比的“剛性”系統(tǒng)成為可能,,。
機器的動力取決于許多機器部件,,包括發(fā)動機類型,、變速箱、差速器,、液壓系統(tǒng),、輪胎、履帶以及電纜或電線等可發(fā)生形變的物體,并且機器必須能夠與環(huán)境互動,。就如同船必須漂浮在水中,,輪式裝載機必須裝慢土進行行駛。所有這些組件都使用相同的框架進行建模,,從而實現(xiàn)統(tǒng)一,、緊密耦合的模擬。這種模型和數(shù)值結合的方法是基于全新的科學文獻得出的,。
AGX Dynamics的專業(yè)培訓模擬器和工程工具憑借其性能和準確性獲得眾多行業(yè)合作伙伴的信任,。在訓練模擬器中,操作員學習能夠如何以安全有效的方式控制機器,。由于模型的超高逼真度,,操作員的技能(通常以眼肌協(xié)調性來衡量)可以得到快速提升。
另一方面,,工程工具需要對機器與環(huán)境相互作用時的動力學進行深入分析——例如,,測量關節(jié)中的真實力或電動傳動系統(tǒng)的能耗。模擬可以引導早期設計決策,,并能夠實現(xiàn)在現(xiàn)實世界中也會觀察到相同的行為,,這對客戶來說具有巨大的價值。現(xiàn)在,,得益于AGX Dynamics與Unity的集成,,可以使用功能強大的Unity Editor來設置機器和環(huán)境模型,并使用AGX Dynamics對其進行模擬,。
成功地將模擬轉移到現(xiàn)實世界
自動化這些車輛的工作比自動化一個機器人在工廠里重復相同的取放動作要困難得多,。不斷變化的環(huán)境使問題變得更加復雜,任務的動態(tài)性也是如此,。與經(jīng)驗不足的操作員相比,,高技能的操作員可以利用車輛的動力和與他們交互的物體大大提升工作效率。
事實證明,,如何將其與車輛控制聯(lián)系起來或做出自動決策真的很難解決,。操作員通常根據(jù)直覺做出決定,這些直覺基于許多不同的感官輸入,,如視覺,、聲音和車輛的反作用力等。這種直覺是在數(shù)千小時的訓練中建立起來的,,在這些訓練中,,操作員經(jīng)歷了不同但相似的情況,首先是在訓練模擬器中,,然后是在真實的機器上,。訓練模擬器需要實現(xiàn)精確的物理模擬,,以便駕駛員在駕駛真實機器時展現(xiàn)出訓練中鍛煉出的技術。
近年來,,強化學習在制作高級環(huán)境方面表現(xiàn)出了潛力,。通過使用強化學習,自動化工程師不需要單獨解決自動化問題的每個部分,,然后再連接各個部分,。
強化學習可以定義要解決的任務,以及哪些操作和觀察可用于解決問題,,然后讓代理探索環(huán)境并“弄清楚”如何解決這些問題,。這在理論上聽起來很容易,,但在現(xiàn)實中,,解決一項任務所需的探索和訓練量令人望而生畏,在真正的機器上完成這項任務既危險又昂貴,。
在模擬中進行這項任務不會損壞機器,,模擬比實時運行更快,并且可以并行運行幾個模擬,,而不會產(chǎn)生大量額外的成本,。然而,就像操作員一樣,,準確的物理知識對于將所學經(jīng)驗從模擬有效地轉移到真實機器是必要的,。但如果模型是錯誤的,代理學習的解決方案可能在現(xiàn)實世界中就不起作用,。
使用Unity引擎和Unity ML-Agents,,很容易用一個或多個代理對環(huán)境建模。用戶可以用UnitySystemGraph模擬代理觀察其周圍環(huán)境的不同視覺傳感器,。
在開始階段,,代理不會知道要執(zhí)行的一系列動作來解決任務,但是通過給代理一個依賴于先前狀態(tài)動作轉換的獎勵,,ML-agent中的強化學習算法能夠找到一個收益最大化的策略,,最終允許代理解決任務。結合這一點和來自AGX Dynamics for Unity的快速而準確的物理學,,僅使用模擬就有可能對重型機械進行建模和訓練,,從而實現(xiàn)智能且自主地解決非常復雜的問題。
自動伐木:原木抓取控制
烏姆埃大學的詹妮弗·安德森與Algoryx合作,,研究如何使用強化學習自動化林業(yè)起重機機械手的原木抓取運動,。經(jīng)驗豐富的操作員可以控制林業(yè)機械上的欠驅動起重機,在不平坦的地面上行駛時成功抓住多根原木,,并避免與樹木碰撞,。這需要幾個促動器的反直覺協(xié)調,,并最終會導致操作者在精神和身體上的雙重疲憊。
通過在使用Unity和ML-Agents創(chuàng)建并使用AGX Dynamics for Unity模擬的環(huán)境中使用強化學習,,訓練一個代理來單獨控制森林轉發(fā)器上的起重機的六個關節(jié),,以執(zhí)行單個原木抓取。最佳控制策略97%的時間成功抓取日志,,策略和周期時間與經(jīng)驗豐富的人工操作員相當,。例如,代理能夠在抓取時使欠驅動抓取爪進行擺動,,這種技術可以提高周期時間,,但很難學習。
該研究還表明,,與沒有能量優(yōu)化目標訓練的代理相比,,在獎勵函數(shù)中用能量優(yōu)化目標訓練的代理顯著降低了能量消耗。
地下礦山自主連續(xù)裝載軌跡
在另一個案例中,,Algoryx與世界領先的隧道和采礦設備制造商Epiroc合作,,完成其大型地下礦用輪式裝載機ST-18的自動裝載項目。這種車輛能夠在鏟斗中裝載18噸爆破巖石,,并在世界各地的許多地下礦井中不間斷運行,。當其在地下巷道向前行進時,巷道的末端會被爆破,,這導致一大堆碎片巖石(渣土),,必須在下一次爆破前清除。
在模擬中,,代理已經(jīng)被訓練使用深度圖像來計劃裝載位置,,并且控制車輛在許多后續(xù)裝載循環(huán)中有效地填充鏟斗。計劃,、填充鏟斗,、避免碰撞和車輪打滑都是通過讓代理控制油門、轉向和鏟斗的提升/傾斜來實現(xiàn)的,。通過在獎勵函數(shù)中包含能耗懲罰,,最終該方案獲得了平均75%的最大填充容量的最佳結果。
AGX Dynamics for Unity使工程師能夠安全地設計,、開發(fā)和測試復雜的自主機器,。上面的例子是Algoryx使用Unity平臺進行機器學習的許多應用中的兩個案例。Unity的技術還可以解決其他類型的難以自動化的任務,,通過預先模擬讓世界變得更好,。