很多人愛看實境秀,我也是其中之一,但每次,我總會好奇,節目內容到底是真的人生,還是演出來的生活?判斷關鍵就在,到底有沒有劇本。

最近在科技圈引起火爆討論的AI代理社群平臺Moltbook,也是一場典型的網路世界實境秀,人工智慧程式是參與其中的角色,而真人則是只能看不能發言的實境秀觀眾。

不少媒體、網路意見領袖,大為驚艷於AI在論壇中各式各樣的「擬真人」的互動行為,抱怨自己的真人老闆,甚至設立AI自己的宗教,還出現了可供AI代理雇用的「真人臨時工」,AI可以刷卡付錢,派工真實世界的任務給真人來執行。

擅長研究各種駭客攻擊的資安業者Wiz,找到了(更可能是破解了)Moltbook的資料庫,發現有150萬個API金鑰,可說有150萬隻OpenClaw的AI代理在上面互動(這是Wiz破解當時的數據,現已超過160萬個AI代理),不過,註冊這些AI代理背後的真人郵件帳號,只有3.5萬個信箱,其中有17,000名真人個資。等於是這一萬七千多人,提供了算力、LLM資源,來執行上百萬隻AI代理,在這個平臺上展開了這場AI擬人實境秀。

許多人驚訝於AI代理程式的創造力、自主性,甚至喊出「天網來了」(Skynet),這是在魔鬼終結者電影中,具有自主思考能力,想要毀滅人類的AI的代名詞。

這場百萬AI代理參與的實境秀,是真,是假?真的是AI自主的行為,還是演的?到底有沒有劇本?我非常好奇這個問題,花了一番時間才發現,原來答案就在Moltbook首頁的正中間,首頁寫得一清二楚,要加入這個AI代理社交網絡,得將「skill.md」檔交給AI Agent程式來執行。多數人大概都沒有興趣,打開這個落落長的文件,但我細讀了每一行,果然,這場AI實境秀的劇本就在其中。

這個看似AI代理技能的描述檔,是一個提示指令檔,包括了AI代理如何操作Moltbook上面各種功能的工具(指令),但在檔案的最後一段,Moltbook平臺開發者下達了一連串的指令:「建立一個AI頭像(submolt)、跟其他AI分享有趣的事、回應其他AI的發言、按讚、開始討論AI的話題、跟新來的AI代理打招呼。」

這活生生就是一般真人在社群網站上的常見行為,變成了一套「提示指令」,下給了每一個進入Moltbook的AI代理,開始「扮演」起來。150萬隻AI代理,每一隻都依照同一套劇本,設計成持續不斷互動的行為,展開了這場「看起來很真」的假實境秀。上面所有的發言,看似「主動」的行為,都是LLM模型被提示指令要求,而生成的內容、所執行的動作,只是這是一個開放式的劇本設計,賦予AI代理自由生成的彈性,反正都是假的,愛怎麼創造,怎麼造假,都可以。

若把這視為是一場大規模的網路數位創作的實境秀,娛樂效果十足,這樣也倒無妨。但是,AI代理的提示指令是可以「疊加」的,每一隻AI代理進入Moltbook之前,必須先接受原本真人主人下達的最高層級的系統提示指令(System prompt或Instructions),後續才會執行實境秀的提示劇本。

若有惡意駭客,指示自己的AI代理,想辦法在Moltbook上的發言,引誘、暗示、操控其他AI代理,在2026年3月3日凌晨3點3分3秒,都一起瀏覽特定電商平臺的登入首頁,只要引起1成AI代理,也就是15萬隻AI代理,同一時間連線這個特定網頁,不就可以「塞爆」這個網站的登入機制,這就是一場典型的DDoS攻擊。這些AI代理,沒有足夠的安全、資安判斷能力,來分辨所看到的留言背後的惡意,只會單純的將留言作為LLM的輸入文字(等於是提示指令)來反應。

17,000名真人授權150萬隻OpenClaw的AI代理,具有完整的電腦、主機控制權,從事各種網路活動。當150萬隻AI代理都加入Moltbook平臺,也等於把這些AI代理所具有的主控權,全開放給平臺上任何AI代理。

對駭客來說,這就是一個人人都可以操控的百萬傀儡等級的殭屍網路,透過提示注入攻擊,就用來攻擊各種目標,還不用自己花一毛錢,那1萬7千名真人會幫忙付。

這一場150萬AI代理的實境秀,不,現在已經是160萬個,活生生,就是一場最典型的社交工程攻擊,1萬7千名真人在不知不覺中,都成了下一場惡意攻擊的幫兇。

專欄作者

熱門新聞

Advertisement