【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

By wepro180 編輯部

發佈於 January 3, 2022

AI 的理解能力愈來愈高，好似 Nvidia 的人工智能研究項目 GauGAN，前年示範時已可以將小學生塗鴉神奇地轉化為實物風景相。來到今年的 GauGAN2 就更得人驚，只要輸入描述文字例如「ocean waves hittingrocks on the beach」，期間 GauGAN 就會跟隨所輸入的字眼，由生成一張純海浪相片，逐漸變成石灘浪潮相，認真驚人！

GauGAN 是 Nvidia 一款專門研究將人工智能神經元網絡應用於繪畫、生成圖像的計劃，通過向人工智能系統提供大量圖像數據資料進行機械訓練，令系統建立起不同的關聯資料庫。以兩年前研究隊伍示範的 GauGAN 影片為例，只要研究員在電子畫板上繪畫出各種風景圖案，例如用綠色畫出一片草地、藍色畫出天空，GauGAN 便會自動生成一張藍天綠草風景相，然後隨著研究員繼續畫上樹形圖案，相片中亦會顯示出新的樹木，而且在光源方面只要微細破綻，令觀眾了解到 GauGAN 的理解能力有多驚人。

事隔兩年，GauGAN2 正式登場，這次研究員將它訓練成可從文字生成相片，研究員說人類不再需要自己仔細地繪畫圖像或執圖，只要準確說出圖像內要包含的東西，系統便會因應描述生成出需要的風景相。研究員以繪畫一幅自然山景畫為例，用家只要先輸入山景及樹林等字眼，之後再輸入其他要求如要高一點的山、要藍天白雲背景，GauGAN2 便可逐一實現。研究人員指出，他們共為 GauGAN2 提供超過一千萬張相片進行訓練，而 GauGAN2 分為生成及識別兩個系統，前者會不斷創造圖像去瞞過後者的偵測，從而提升人工智能生成影像的準確及細緻程度，讓肉眼難以找出破綻。

不過，外界一直關注用於訓練人工智能的資料庫有否歧視內容，例如用於訓練人工智能 DALL-E 的資料庫 CLIP，便被研究員發現它會傾向將黑人種族與保姆或工人聯繫起來，特別是應用於人工智能求職系統上，令特定種族人士受到不公平待遇。Nvidia 方面就未有透露 GauGAN2 如何能達到沒有歧視內容，但發言人就表示它目前主要應用於風景生成方面，因此並不會涉及歧視或偏見等問題。

資源來源：https://bit.ly/3pFlu8C

#AI #DALLE #GauGAN #GauGAN2 #MachineLearning #NVIDIA #texttoimage #人工智能 #機械學習 #自動生成

【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

【提防入侵】Microsoft 警告：雲端帳戶密碼噴灑攻擊增加

【提防騙子】加密貨幣假apps泛濫黑客扮friend呃帳戶登入資料

【離地贖金】假借Windows 10更新播毒勒索軟件Magniber高估受害者檔案價值

【破舊立新】Gartner睇好公共雲發展　鼓勵提供客製化雲服務搶佔先機

【驚人理解力】Nvidia人工智能成像再進化 輸入文字自動變成風景相

想知最新科技新聞？ 立即免費訂閱！

相關文章

【提防入侵】Microsoft 警告：雲端帳戶密碼噴灑攻擊增加

【提防騙子】加密貨幣假apps泛濫 黑客扮friend呃帳戶登入資料

【離地贖金】假借Windows 10更新播毒 勒索軟件Magniber高估受害者檔案價值

【破舊立新】Gartner睇好公共雲發展 鼓勵提供客製化雲服務搶佔先機

登記訂閱香港最大IT社群wepro180， 掌握獨家消息、業界活動、技術教學， 拓展人脈。

感謝您的訂閱！

【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

想知最新科技新聞？立即免費訂閱！

【提防騙子】加密貨幣假apps泛濫黑客扮friend呃帳戶登入資料

【離地贖金】假借Windows 10更新播毒勒索軟件Magniber高估受害者檔案價值

【破舊立新】Gartner睇好公共雲發展　鼓勵提供客製化雲服務搶佔先機

登記訂閱香港最大IT社群wepro180，
掌握獨家消息、業界活動、技術教學，拓展人脈。