【驚人理解力】Nvidia人工智能成像再進化 輸入文字自動變成風景相
AI 的理解能力愈來愈高,好似 Nvidia 的人工智能研究項目 GauGAN,前年示範時已可以將小學生塗鴉神奇地轉化為實物風景相。來到今年的 GauGAN2 就更得人驚,只要輸入描述文字例如「ocean waves hittingrocks on the beach」,期間 GauGAN 就會跟隨所輸入的字眼,由生成一張純海浪相片,逐漸變成石灘浪潮相,認真驚人!
GauGAN 是 Nvidia 一款專門研究將人工智能神經元網絡應用於繪畫、生成圖像的計劃,通過向人工智能系統提供大量圖像數據資料進行機械訓練,令系統建立起不同的關聯資料庫。以兩年前研究隊伍示範的 GauGAN 影片為例,只要研究員在電子畫板上繪畫出各種風景圖案,例如用綠色畫出一片草地、藍色畫出天空,GauGAN 便會自動生成一張藍天綠草風景相,然後隨著研究員繼續畫上樹形圖案,相片中亦會顯示出新的樹木,而且在光源方面只要微細破綻,令觀眾了解到 GauGAN 的理解能力有多驚人。
事隔兩年,GauGAN2 正式登場,這次研究員將它訓練成可從文字生成相片,研究員說人類不再需要自己仔細地繪畫圖像或執圖,只要準確說出圖像內要包含的東西,系統便會因應描述生成出需要的風景相。研究員以繪畫一幅自然山景畫為例,用家只要先輸入山景及樹林等字眼,之後再輸入其他要求如要高一點的山、要藍天白雲背景,GauGAN2 便可逐一實現。研究人員指出,他們共為 GauGAN2 提供超過一千萬張相片進行訓練,而 GauGAN2 分為生成及識別兩個系統,前者會不斷創造圖像去瞞過後者的偵測,從而提升人工智能生成影像的準確及細緻程度,讓肉眼難以找出破綻。
不過,外界一直關注用於訓練人工智能的資料庫有否歧視內容,例如用於訓練人工智能 DALL-E 的資料庫 CLIP,便被研究員發現它會傾向將黑人種族與保姆或工人聯繫起來,特別是應用於人工智能求職系統上,令特定種族人士受到不公平待遇。Nvidia 方面就未有透露 GauGAN2 如何能達到沒有歧視內容,但發言人就表示它目前主要應用於風景生成方面,因此並不會涉及歧視或偏見等問題。