「只用不問」危險模式

AI發展速度驚人,更新換代以月為單位,數月間數碼生態圈可大變。去年AI代理還在構建階段,今天用家隨時可網上下載。近日傳媒廣泛報道,中國大陸民眾湧到深圳某廣場,帶着手提電腦及主機排隊安裝「龍蝦」。民眾一窩蜂試用,這是中共所謂領先智能社會的策略,地方政府配合大力宣揚及提供資助的結果,但提醒民眾數碼安全的就只有官方微信帳號的寥寥幾句,非專業人士看不懂的建議。「龍蝦」真身其實是Openclaw(如今已改名做Moltbot)的人工智能代理(Agentic AI),用了一個卡通化的龍蝦標記,以致在中國大陸被稱為「龍蝦」,而養「龍蝦」就是將這個智能代理安裝到個人裝置之上。「龍蝦」不再停留於AI對話,而是進化至主動執行及處理事項。獲取授權後,它有能力讀取即時通訊、閱讀文件、回覆電郵、安排行程、取得軟件內容及操作軟件、自行到互聯網搜尋資料、進行賬單付款等任務,如同一個不眠不休的個人助理。Openclaw去年11月才面世,短短兩三個月便引起了大量人工智能投資概念。智能代理急速發展有機當然仍有危。各種宣傳集中於使用,論述運作及風險的卻不成比例。這種「只要用不要問」的模式,令整個數碼生態圈凶險非常。

資安超級「大黑洞」

聽到有Al個人助理,用戶可能都會心癢癢,但進行安裝之前你最好認清自身能力及相關風險。聽到「龍蝦」開源且在地執行,很多人便誤以為這是安全。要知道開源並不等同安全,軟件本身就有嚴重安全漏洞,下載鏈亦早已成為攻擊對象,若不懂確認是原版,隨時下載了有毒版。在地執行不代表一切在地,代理雖然把處理資訊後的矢量(vector)在地存放,但它可擁有不在地的模塊,如插入(plugins),技能(skills),外部API,呼喚第三方應用等,更不代表在地資訊不被上傳,沒有設定私隱圍欄隨時將個人私隱資訊送出。專家已發出警告,「龍蝦」預設安全配置脆弱,有高風險的「提示注入」(prompt injection)、「日誌投毒」(log poisoning)、「技能投毒」(skill poisoning)。若你不是專家,難以全面理解上述所指。有人依靠AI提供風險控制建議,但如果相關知識缺口龐大,亦難以判斷AI建議是否足夠及執行上是否準確。換句話說,絕大部份用家根本不知道自己不知道甚麼(don't know what you don't know),遑論執行有效保護措施。因需要分析資訊及執行動作,「龍蝦」可擁極多入侵性權限,包括讀取電郵及檔案、直接操作軟件、安裝程式或插件,甚至修改系統。一旦代理行為有任何差池,有能力全權控制你的帳戶及裝置,直接將帳戶極敏感資料傳送,甚至借用身份進行活動,用戶因此可能要負上法律責任。

(網絡圖片)
(網絡圖片)

智能代理四大範疇

養「龍蝦」前你需要深入理解智能代理的四大範疇。首先是指令(prompt),你需要清楚輸入的觸發點,例如一條訊息或者一個電郵,你需要懂得控制輸入範圍及防止指令提示或插入。第二,知識來源的界定。因為智能代理要理解你擁有的資訊及習慣,輸入可以極其廣闊,包括你的個人資料,必须清楚掌握輸入控制範圍,設定圍欄。第三是大型語言模型(LLM)的管理,LLM用作生成決策與語言,其供應鏈必须風險管理,生成的內容需要風險控制。並設定能力界限、明確甚麽可做、甚麽不能做。第四是技術(skill)的執行介面管理,將LLM輸出轉變成動作,呼叫技術,技術範圍需定義,並防止命令注入及權限濫用。另外,「龍蝦」自動吃Token,若用户未有嚴控,隨時收到巨額帳單。所以關鍵執行不應全面自動化,而是設有「人工介入」(Human in the loop - HITL) 。可見駕馭「龍蝦」的能力要求門檻極高。請先自問對這四大範疇有多少把握再考慮安裝。若真的要試,最好找專業指導,並利用沙盒模式,學習運作,填補知識空缺,逐步放寬限制。請特別留意,智能代理令「豬隊友」問題急劇惡化。一旦你的聯絡方使用「龍蝦」,若對方能力不足,與對方聯繫面對極高風險。要判斷對方有否養「龍蝦」有一定困難,但亦有跡可尋,例如你發訊息對方「秒回」,回答的模式異於你認識的人,用字不尋常。你亦可利用旁敲側擊方法,例如直接問他「龍蝦」使用經驗如何。請提醒家人朋友小心處理人工智能代理的風險。不負責任地安裝,累己累人。

「龍蝦」的真身是一頭「老虎」,可「吃掉」你及你家人朋友的資料與數碼安全,甚至盗去你的數碼身份。未成為合格的「馴獸師」之前,筆者奉勸一句,不要養虎為患。◇

 

 

-------------------
局勢持續演變
與您見證世界格局重塑
-------------------

🔔下載大紀元App 接收即時新聞通知:
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand

📰周末版實體報銷售點👇🏻
http://epochtimeshk.org/stores