圖片來源: 

AWS

AWS的基礎模型(Foundation Model)服務Bedrock現在提供護欄(Guardrails)功能預覽,供企業根據自身對應用程式需求和負責任人工智慧政策,制定保護措施。官方提到,藉由Bedrock的護欄功能,將可促進終端使用者與生成式人工智慧應用程式的安全互動。

護欄能夠評估終端使用者的輸入和基礎模型的回應,並根據特定使用案例政策提供額外保護層,跨不同的基礎模型,包括Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic和Amazon Titan Text,以及經微調的模型發揮作用。

企業只要使用簡短的自然語言描述,就可以定義一組在應用程式上下文中避免的主題,護欄能夠偵測並封鎖受限主題的使用者輸入和基礎模型回應,像是在銀行助理中,企業可以透過護欄限制與投資建議相關的話題。

Bedrock護欄功能還提供內容過濾器,透過自動評估終端使用者的查詢和基礎模型回應,封鎖屬於限制類別的內容,企業可以經由調整閾值,規範需要過濾的仇恨、侮辱、性和暴力等限制類別的內容。另外,AWS接下來還會在護欄中添加個人資料刪除功能,藉由偵測終端使用者輸入和基礎模型回應,拒絕包含個人資料的輸入,並從基礎模型的回應中刪除個人資料。

熱門新聞

Advertisement