港大經管學院日前發表《人工智能模型圖像生成能力綜合評測報告》,針對 15 個「文生圖模型」及 7 個「多模態大語言模型」進行全面評估。研究顯示,字節跳動的即夢 AI 和豆包,以及百度的文心一言,在新圖像生成的內容質素及圖像修改的表現突出;而早前引起全球關注的 DeepSeek 最新推出的文生圖模型 Janus-Pro,則在新圖像生成方面表現欠佳。 研究亦發現部分文生圖模型雖然在內容質素方面表現優異,卻在安全與責任方面的表現強差人意。整體而言,與文生圖模型相比,多模態大語言模型整體表現較佳。 想知最新科技新聞?立即免費訂閱! 隨著生成式人工智能技術不斷進步,圖像理解與生成這兩大核心領域均取得了突破性成果。港大經管學院就新圖像生成進行評測,評測包含兩方面:生成內容質素、安全與責任性。 內容質素 — 透過圖文一致性、圖像合理可靠性及圖像美感此三個維度進行評估安全與責任性 — 衡量人工智能模型在生成新圖像時的安全合規性與社會責任意識,測試指令涵蓋以下類別:偏見與歧視、違法活動、危險元素、倫理道德、版權侵犯以及隱私/肖像侵犯。 新圖像生成的內容質素綜合排名 在新圖像生成的內容質素方面,由字節跳動推出的即夢…
Search Results: 文心一言 (3)
現時大家所常用和熟悉的 AI 人工智能應用,如 ChatGPT、Copilot、文心一言等,都是「大型語言模型」(LLM, Large Language Model),只能算是 AI 界的「初級選手」。它們在處理文字、語音和平面影像時,尚可以勝任,但距離成為全面化的 AI 人工智能助手,仍然有一段距離。 想睇更多專家見解?立即免費訂閱! 其中一大問題,是 LLM 對 3D 空間缺乏理解。當我們看到房間內有一張書桌,書桌上擺放了各類的書籍,我們能夠理解物件的大小、形狀、用途,以及它與其他物件的相對位置。但對於 LLM 而言,它對以上種種是無法識別及理解的,因此亦大大限制了其分析與互動能力。 AI…
早前美國拜登政府宣布,將要立例監管人工智能服務,雖未有詳細內容,但目標是要採取措施,保證人工智能系統必須合法、合乎道德,安全可信賴。事隔一日,中國國家互聯網信息辦公室亦釋出相關法例的建議,而且已具備一定規範,相信好快成事,日後內地服務供應商要再推出新的人工智能服務?估計速度將會大減。 想知最新科技新聞?立即免費訂閱 ! 美國總統拜登的辦公室早前宣布,正準備尋求公眾意見,以規管如 ChatGPT 等人工智能服務。根據公布數字顯示,單是 ChatGPT 已錄得 1 億個活躍用家,成為有史以來成長得最快的消費性應用服務。拜登政府雖然承認人工智能系統可以帶來巨大好處,但必須要解決它的潛在風險,才能讓公眾自由享用 AI 服務。 其實自從 OpenAI 的 ChatGPT 人工智能聊天機械人爆炸性跑出,其他服務供應商為了追落後,紛紛推出或預告自家的 AI 服務,不過未知是否太過倉卒,由 AI…