AWS宣布Bedrock Guardrails中的自動推理(Automated Reasoning)檢查功能正式上線,官方表示,這項功能運用數學邏輯與形式化驗證技術,能將大型語言模型生成內容與既定政策或領域規範進行對照,驗證準確率可達99%。對需要在高法規遵循的環境,控制人工智慧輸出品質的開發團隊而言,這提供了一套可追溯、可量化的驗證機制,用以降低幻覺並及早發現潛在歧義。

自動推理檢查功能會將自然語言撰寫的政策或規範轉換為可機器推理的邏輯表示,並依嚴格規則檢驗模型回應是否符合條件。這與常見依賴機率推論的方法不同,後者在不確定情況下會替各種結果分配機率,而自動推理則基於可證明的驗證框架,提供明確的有效、無效或依假設而定的可滿足判定。

AWS提供的自動推理檢查功能,可支援相當100頁內容的大型文件,約8萬個Token(理論規格上限為122,880個Token)。用戶可以儲存並重複執行驗證測試,確保政策調整後結果一致,系統也會自動產生測試情境,減少人工設計案例的時間成本,其他強化功能包括自然語言化的政策修改建議,以及可自訂信心分數門檻,以配合不同應用場景的檢核需求。

在使用上,開發者可於Bedrock控制臺上傳政策文件,系統會解析出規則、變數及自訂型別,將條文轉化為可運算的邏輯結構。隨後可透過自動或手動測試情境輸入模型生成的問答內容,檢驗其與政策的一致性,當測試失敗,可追溯至觸發矛盾的規則來源,以便調整政策或測試案例。

自動推理檢查可與Bedrock Guardrails的其他防護措施搭配使用,例如內容過濾與情境對齊檢查,並不限於AWS模型,也能透過ApplyGuardrail API應用於第三方模型,包括OpenAI與Google,或整合至代理框架。

目前自動推理檢查已在美東、美西及歐洲等AWS區域上線,計費依處理文字量與驗證請求計算。AWS同時提供技術文件與GitHub範例,協助開發者導入並測試此功能。

熱門新聞

Advertisement