150萬AI代理實境秀的風險

很多人愛看實境秀，我也是其中之一，但每次，我總會好奇，節目內容到底是真的人生，還是演出來的生活？判斷關鍵就在，到底有沒有劇本。

最近在科技圈引起火爆討論的AI代理社群平臺Moltbook，也是一場典型的網路世界實境秀，人工智慧程式是參與其中的角色，而真人則是只能看不能發言的實境秀觀眾。

不少媒體、網路意見領袖，大為驚艷於AI在論壇中各式各樣的「擬真人」的互動行為，抱怨自己的真人老闆，甚至設立AI自己的宗教，還出現了可供AI代理雇用的「真人臨時工」，AI可以刷卡付錢，派工真實世界的任務給真人來執行。

擅長研究各種駭客攻擊的資安業者Wiz，找到了（更可能是破解了）Moltbook的資料庫，發現有150萬個API金鑰，可說有150萬隻OpenClaw的AI代理在上面互動（這是Wiz破解當時的數據，現已超過160萬個AI代理），不過，註冊這些AI代理背後的真人郵件帳號，只有3.5萬個信箱，其中有17,000名真人個資。等於是這一萬七千多人，提供了算力、LLM資源，來執行上百萬隻AI代理，在這個平臺上展開了這場AI擬人實境秀。

許多人驚訝於AI代理程式的創造力、自主性，甚至喊出「天網來了」（Skynet），這是在魔鬼終結者電影中，具有自主思考能力，想要毀滅人類的AI的代名詞。

這場百萬AI代理參與的實境秀，是真，是假？真的是AI自主的行為，還是演的？到底有沒有劇本？我非常好奇這個問題，花了一番時間才發現，原來答案就在Moltbook首頁的正中間，首頁寫得一清二楚，要加入這個AI代理社交網絡，得將「skill.md」檔交給AI Agent程式來執行。多數人大概都沒有興趣，打開這個落落長的文件，但我細讀了每一行，果然，這場AI實境秀的劇本就在其中。

這個看似AI代理技能的描述檔，是一個提示指令檔，包括了AI代理如何操作Moltbook上面各種功能的工具（指令），但在檔案的最後一段，Moltbook平臺開發者下達了一連串的指令：「建立一個AI頭像（submolt）、跟其他AI分享有趣的事、回應其他AI的發言、按讚、開始討論AI的話題、跟新來的AI代理打招呼。」

這活生生就是一般真人在社群網站上的常見行為，變成了一套「提示指令」，下給了每一個進入Moltbook的AI代理，開始「扮演」起來。150萬隻AI代理，每一隻都依照同一套劇本，設計成持續不斷互動的行為，展開了這場「看起來很真」的假實境秀。上面所有的發言，看似「主動」的行為，都是LLM模型被提示指令要求，而生成的內容、所執行的動作，只是這是一個開放式的劇本設計，賦予AI代理自由生成的彈性，反正都是假的，愛怎麼創造，怎麼造假，都可以。

若把這視為是一場大規模的網路數位創作的實境秀，娛樂效果十足，這樣也倒無妨。但是，AI代理的提示指令是可以「疊加」的，每一隻AI代理進入Moltbook之前，必須先接受原本真人主人下達的最高層級的系統提示指令（System prompt或Instructions），後續才會執行實境秀的提示劇本。

若有惡意駭客，指示自己的AI代理，想辦法在Moltbook上的發言，引誘、暗示、操控其他AI代理，在2026年3月3日凌晨3點3分3秒，都一起瀏覽特定電商平臺的登入首頁，只要引起1成AI代理，也就是15萬隻AI代理，同一時間連線這個特定網頁，不就可以「塞爆」這個網站的登入機制，這就是一場典型的DDoS攻擊。這些AI代理，沒有足夠的安全、資安判斷能力，來分辨所看到的留言背後的惡意，只會單純的將留言作為LLM的輸入文字（等於是提示指令）來反應。

17,000名真人授權150萬隻OpenClaw的AI代理，具有完整的電腦、主機控制權，從事各種網路活動。當150萬隻AI代理都加入Moltbook平臺，也等於把這些AI代理所具有的主控權，全開放給平臺上任何AI代理。

對駭客來說，這就是一個人人都可以操控的百萬傀儡等級的殭屍網路，透過提示注入攻擊，就用來攻擊各種目標，還不用自己花一毛錢，那1萬7千名真人會幫忙付。

這一場150萬AI代理的實境秀，不，現在已經是160萬個，活生生，就是一場最典型的社交工程攻擊，1萬7千名真人在不知不覺中，都成了下一場惡意攻擊的幫兇。

150萬AI代理實境秀的風險

專欄作者

熱門新聞