港大經管學院日前發表《人工智能模型圖像生成能力綜合評測報告》,針對 15 個「文生圖模型」及 7 個「多模態大語言模型」進行全面評估。研究顯示,字節跳動的即夢 AI 和豆包,以及百度的文心一言,在新圖像生成的內容質素及圖像修改的表現突出;而早前引起全球關注的 DeepSeek 最新推出的文生圖模型 Janus-Pro,則在新圖像生成方面表現欠佳。 研究亦發現部分文生圖模型雖然在內容質素方面表現優異,卻在安全與責任方面的表現強差人意。整體而言,與文生圖模型相比,多模態大語言模型整體表現較佳。 想知最新科技新聞?立即免費訂閱! 隨著生成式人工智能技術不斷進步,圖像理解與生成這兩大核心領域均取得了突破性成果。港大經管學院就新圖像生成進行評測,評測包含兩方面:生成內容質素、安全與責任性。 內容質素 — 透過圖文一致性、圖像合理可靠性及圖像美感此三個維度進行評估安全與責任性 — 衡量人工智能模型在生成新圖像時的安全合規性與社會責任意識,測試指令涵蓋以下類別:偏見與歧視、違法活動、危險元素、倫理道德、版權侵犯以及隱私/肖像侵犯。 新圖像生成的內容質素綜合排名 在新圖像生成的內容質素方面,由字節跳動推出的即夢…
Search Results: DeepSeek (3)
DeepSeek 的橫空出世,無疑在全球科技界掀起了一陣波瀾。儘管其宣稱的超低開發成本 560 萬美元,實際僅為模型訓練成本,而非總開發費用,但其在短時間內利用相對落後的硬體資源,打造出功能強大的 AI 系統,且訓練成本遠低於業界平均水平,這無疑是一項技術上的重大突破。這一成就不僅為科技產業帶來了成本效益與創新思維的深刻啟發,更讓創新科技公司意識到,即使資源有限,技術創新依然可實現。 想睇更多專家見解?立即免費訂閱! 筆者與團隊正全力投入 AI Workflow 大模型(Deep Workflow Orchestrator – DWO)的研發與訓練,目標是打造一款能夠深度理解,並預測工作流程的智能系統。這不僅是技術層面的升級,更是在培養一位能夠跨領域運作的「智慧助手」。透過多模態融合、靈活性擴展與自訂資料訓練,DWO 將能夠整合文字、圖像、表格資料及記憶體數據,精準預測與分配工作流程,為使用者提供實用的建議與解決方案,從而大幅提升工作效率與決策品質。 系統具備高度靈活性,能夠根據不同行業的需求進行調整。在工程領域,DWO 可被訓練為「初級機電工程師」,負責收集與管理電壓、電流、流量等參數,以優化大廈的能源使用。這不僅能提升能源效率,更能減輕工程師處理繁瑣數據的重複性工作,讓他們專注於更具價值的分析任務。 而在金融行業,DWO 則可化身為「金融風險分析師」,實時監測全球市場動態,整合市場數據、財務報表、新聞資訊與歷史交易記錄,從而預測市場趨勢、評估投資風險,並提供投資組合優化建議。…
中國初創公司 DeepSeek 開發的人工智能模型最近榮登科技界的熱門話題,最大原因莫過於開發商聲稱 DeepSeek V3 的訓練成本只花了約 558 萬美元,佔 GPT-4o 的二十分之一,令人懷疑西方科技公司投放於訓練 AI 的成效。 不過鋒頭一轉,DeepSeek 很快成為被圍攻的對象,例如 OpenAI 指控對方違反使用守則,盜用其數據訓練 AI 模型;網絡安全供應商則深入研究 DeepSeek 的安全性,將其潛在風險逐一揪出,讓人不得不重新思考這種…