【獨家專訪】拆解 In-memory Computing 奧義!
現今世界秒秒鐘幾百上落,海量嘅操作、交易、分析數據能否達到實時可見(real-time visible)成為是關鍵,慢一秒都不能,運算速度主宰企業生死存亡。繼續以傳統方法進行運算簡直等同自殺,因此,In-memory Computing 成為最熱門的技術。In-memory Computing 的奧義何在?我們找來 In-memory Computing 領域的表表者 GridGain 的專家問個究竟。
Scale up 不是最好方法,現在要 scale out
「以前做 IT 有術語叫 Blackout(停機),當然絕對不能發生的。但今時今日,連 Brownout(慢機)都不可接受了。」近年數碼世界,企業引用大數據、實時處理資料、快速支付乃至 AI 均對運算速度要求極高,任何 brownout 或 latency 都會嚴重影響業務,。「企業就算進行 scale up,增加更多 hard disk,成為一台大怪獸,亦不是辦法。一來成本高,最大難題是 scale up 到盡都無法追上加速的要求。」傳統方式已經不足以應付,Frank Lam 解釋,scale up 不是最好方法,現在要 scale out。
運算速度提升 5,000 甚至 10,000 倍
「傳統的運算方式,是從 hard disk (硬盤)取得資料,交到 RAM,再傳送到 CPU 計算,然後再放回 dard disk,但這樣很花時間。所以要從 RAM (記憶體)入手,即是 In-memory Computing 技術。」In-memory Computing 的概念是 scale out,將多部較平宜的器材如 X-86 機串連,用分佈式計算,成本效益可以提很多。「In-memory Computing 技術就是以 RAM 取代 hard disk,將 data 與 CPU 之間的距離縮短,在 RAM 內完成所有運算工作,此舉可將速度提升 5,000 甚至 10,000 倍。」
奧妙之處,是運算與儲存分工
Stephen Leung 指出,GridGain 的技術可以支援超過 1,000 台電腦的串連,企業可輕易建構自己的超級電腦,更重要的是,企業無需放棄固有的 hard disk。「GridGain 是固有的 hard disk 與 application 的橋梁,即是在 data 與 application layer 之間的 acceleration layer,一面應付 application 的運算,一面將資料儲存到 data layer。」GridGain 的奧妙之處,是運算與儲存分工,RAM 負責運算,Hard disk 負責儲存記錄,企業可以保存既有 hard disk ,同時享受快速的運算應用。
另一奧義在於兼容
GridGain 的另一特別之處是其 unified API。「GridGain 能兼容市場上兩種訪問方式,而程式員更可以 open source 作業,兼容包括 SQL、JAVA、C++、.NET、PHP 等 protocol,無需學習特別的編寫語言。」ANSI-99 SQL、key-value 或 REST APIs 都可以支援,對 IT 朋友來說是一大喜訊,因此 GridGain 在 In-memory Computing 領域表現特別出色。
極速鯨吞海量數據
近年業界對電腦運算速度的要求越來越高,擴大了 In-memory Computing 的市場。GridGain 的客戶遍佈世界,當中不乏跨國銀行、金融集團、旅遊網站等,其共通之處,就是需要實時處理海量資料。「但凡需要處理海量的實時運算,都需要 In-memory Computing。例如金融、銀行、証券公司,另一種是以網上服務為主的行業如航空酒店預訂服務、物流、電子商貿等,還有需要高速運算的科研項目如 AI、Streaming Analytics。」GridGain 將會與 Google 的 TensorFlow 合作,於 Machine Learning 及 Deep Learning 領域繼續進發,期待不久的將來帶來更多突破。