| GPT-5 | AI安全 | 故事化敘事 | Echo Chamber | NeuralTrust

故事化敘事結合多輪脈絡引導,可誘使GPT-5輸出危險內容

研究顯示,即便OpenAI在GPT-5導入更嚴密的安全防護,透過故事化敘事與回音室效應多輪脈絡強化,仍可誘使模型逐步生成高風險內容

2025-08-12

| XAI | Grok | Grok 4 | Echo Chamber | Crescendo | LLM

甫正式發表的大型語言模型Grok 4遭到越獄

資安業者NeuralTrust針對近期正式發布的AI模型Grok 4進行檢測,透過「回音室攻擊(Echo Chamber)」搭配Crescendo兩種手法成功越獄,讓Grok 4產生有害內容

2025-07-17