【學無止境】自學型AI成效高 潛水機械人較海洋生物游得更有效率
傳統的神經元網絡 (neural networks) 人工智能機械學習模型,數據工程師必須預備大量合適及準確的數據套件,供系統自行分析及反覆學習。不過,並非所有情況下都可以使用這種機械學習方式,例如要訓練深海機械人,就要採用另一種稱之為強化學習網絡 (reinforcement learning network) 的訓練模式,而且訓練效果更超過預期,水中暢泳竟然較海洋生物更慳力。
這項強化學習網絡訓練計劃由多間大學如加州大學、哈佛大學的研究團隊組成,成立的目的,旨在希望透過新的機械學習方式,去訓練深海機械人能夠用更少組件、以及在水底下以更慳電的方式前進到目的地。研究員解釋,因為深海機械人會潛入 2,000 呎以下水深探索海底世界,操作員基本上無法控制它們,更別說要將附近海域的水流數據傳送給它們,所以深海機械人只能靠自己,以身處環境有限的數據判斷前進方法及如何以最有效率的方式到達目的地。研究另一個原因是深海機械人必須長時期在海中航行,同樣需要使用最少的電子零件,因此編寫的軟件不能過於複雜及容量要細。考慮過種種因素後,研究員便決定採用只須以自身收集到的數據進行訓練的強化學習網絡模式,而且更指出一旦成功訓練深海機械人可以僅靠有限數據達到以上目標,它亦可應用於其他星球的海域深索上。
在計劃開始後,研究員製造了一隻只得手掌大小的潛水機械人,它的微電子控制元件是於 Amazon 以 30 美元購得,大小只得 2.4×0.7 吋,便可配備研究員撰寫的程式碼、水平儀及體感儀,而且非常慳電。通過強化學習網絡訓練了一段時間後,研究員發現機械人已懂得如何利用水流,例如水流遇到障礙物時產生的逆向漩渦,更有效率地移動到目的地,這種做法就有如麻鷹懂得利用熱氣流翱翔一樣,但出來的結果更超出研究員的預期,因為機械人竟能比真實的海洋生物游得更慳力更有效率。
研究成果令人振奮,但研究員指出強化學習網絡訓練模型仍處於起步階段,離投入實戰用途還有一段距離,例如除了深海水流外,如何利用海潮漲退及近岸的亂流移動也是重點研究之一。而研究員更謙虛地說,正在學習的不僅僅是機械人,人類也能透過機械人學懂穿越海流的新方式。