【隨筆賞科技】AI尚未成功,團隊正在努力
現時的「大型語言模型」(LLM, Large Language Model)雖然聰明,然而其聰明只在於模仿能力極高,它卻會出現「幻覺」、錯誤推理、整合出偏離的答案。筆者早前探訪一位企業客戶,他已廣泛應用 LLM 協助企業工作,初用時覺得非常便捷,但日子久了卻發現 AI 所提交的答案未如理想,並非他確切所要的回覆。
的確,現時市面上的商用 AI 軟件,未必完全能適切每個機構的用途,許多時仍需要專業科研人員發出像魔法咒語般的提示詞或程式碼,才能發揮其功能。當一般用戶在實際應用時,未必可以用得稱心如意。而且 AI 的回應亦難以控制,回覆跟用戶所期望的答案多有落差。
這亦讓我反思,如何讓企業使用者更好地管理、控制及運用 LLM?雖然 LLM 已經表現不錯,但要它確切理解用戶的需要再作出回應,當中似乎仍有缺口。
早前業內人士發布了新一代基座大模型 GLM-4,它能夠自主地根據使用者意圖,自動理解及規劃複雜指令。這正是我思考的方向,也是我們團隊正開發的 All in One 人工智能平台 —— AI LIFE。它可結合 LLM,實時融匯 IoT、PNT 及大數據,駁通不同的 API,進行快速分析,向有關使用單位提供即時的對應方案。
用戶可根據自己所想,有效地驅動它理解並執行複雜的指令。舉例問它:「睇下公司數據庫,A 產品仲剩幾多貨?」回答這個問題的難度在於,模型要理解廣東話「睇下」、「仲剩幾多」的意思,同時問題中也沒有告之是哪個數據庫、要在哪兒搜尋。模型會懂得自動接駁公司數據系統進行搜索,根據該指令自行規劃檢索任務、自行選擇資訊來源、自行與資訊來源互動,再提交回應給你。
我們團隊正在努力建構 AI LIFE,目的是開發出更理想的管理 LLM 平台,以填補落差,先理解用戶的發問(Reasoning),繼而作出相應回覆(React)。看似簡單,但過程卻殊不簡單,特別是我們用的廣東話,字詞多義又多變化,上述例子中「睇下」已含觀看、檢視、查閱等意思,日常我們又會講成「睇睇」、「Check 下」、「數下」等不同說法,要讓模型準確理解用戶的意思並非易事,不過我們已經在開發的長跑中走得很前,期待着衝線的一刻!
作者:思路富邦集團(SagaDigits)創辦人陳智銓(Arthur)
欲觀看更多 Arthur 撰寫的文章,可按此瀏覽。