【保密金鐘罩】數據保護技術睇真啲
數據外洩威脅急劇上升,保護數據庫變得日漸重要。現時網絡安全界已使用多種技術來保護數據,複雜性也在不斷發展,例如同態加密(Homomorphic encryption)、混入假數據等等,無非都是為了阻止黑客入侵。
最簡單的保護數據庫方法之一,是將數據資料分開儲存。研究人員只可以讀取第一個數據庫,具有完整資料的數據庫就會儲存於其他地方,檢查數據時必須利用演算法去還原完整數據,免除研究人員遺失數據的責任。同態加密是比較複雜的保護數據方案,系統會將敏感資料完全加密,研究人員要調用真實數據時,系統便會進行同態運算,令數據在毋須解密下都可被搜尋。十多年來,IBM 一直在為同態加密技術作出貢獻,例如提供適用於 Linux、iOS 和 MacOS 的工具包,以及安全儲存和處理數據的雲端環境。不過,同態加密還未成熟,因為需要太多運算,拖慢檢索速度,如要在大型數據庫使用便難以負荷。
現時數據保護服務供應商採用的加密方法,主要是加密數據庫內的資料,不過並非全面加密,而是平衡保密與共享原則,只向研究人員透露非私密訊息,減低運算負荷。一般的做法是加密姓名、地址等個人敏感資料,只有獲得演算法密鑰的特定人員可以訪問,其他用戶只可讀取未加密的部分。單向函數密鑰(如 SHA256 hash 算法)是最常用的演算技術,如欠缺這條密鑰,攻擊者便無法逆轉計算出原來的數據。
將假數據混入數據庫也是另一種常用手段,因為隨機噪音(random noise)可令識別個人記錄變得困難。Google最近便將名為 Privacy-on-Beam 的內部工具變成開源技術,用戶可以將噪音混入數據庫,然後才儲存到 Google Cloud 數據庫。不過當噪音資料被混合在數據庫內,有可能令資料準確度出現問題,因此最近微軟亦提供了一個與哈佛大學科學家合作開發的差異私隱(Differential Privacy)工具包,它可被應用於訓練人工智能或分析營銷活動數據,而不被噪音影響準確度。
保護數據庫的實際用例
1)中央數據庫會保存完整的合規數據,分支機構則會刪除有價值的數據,可以在安全方面節省時間和金錢。
2)如果企業或學校要跟研究人員共享數據,它可能會提供一個已模糊個人訊息的數據庫版本,而完整版本則由自己保留,有需要時才調去。
3)鼓勵遵守儲存數據法規,同時維護客戶的私隱。
4)保護軍事行動的戰略機密,同時與盟友共享足夠的數據。
5)建構一種商務系統,最大限度地減少內幕交易的危險,同時仍然可以跟踪所有交易及符合法規。
6)於會計系統採用一種平衡披露資訊與保護私隱的欺詐檢測系統。
開源項目可說是數據保護發展的重要資源,例如一個名為 OpenDP 的開源項目,它成立的目的是希望將多種數據保密技術的框架及演算法集合,讓用戶可自行選擇去保護不同重要性的數據。
雖然數據保護技術在某程度上無懈可擊,但攻擊者卻可在其他地方發現漏洞,例如攻擊操作系統、通訊層的漏洞,又或從多個途徑截取數據,還原出原來的數據。因此企業或機構在儲存機密數據時,不能完全依賴數據保護服務,必須從多方面審視有無薄弱的地方,盡快堵塞漏洞,才能避免發生數據外洩問題。