Anthropic Claude推出第二代，加入以網頁存取、支援API、擴大公測

圖片來源:

Anthropic

AI新創公司Anthropic在5月介紹AI聊天機器人Claude，而短短2個月內，又在本周宣布更新到第2代，提升效能及安全性，加入以公開網頁及API存取的介面，也將公測對象推到美、英兩國用戶。

Anthropic指出，測試第一代Claude的用戶反映Claude很好聊、能清楚解釋其思路，較不會提供有害回應，記憶力也較長久。而第二代Claude則大幅強化程式撰寫、數學及推理能力。例如它在律師考試的多選題得分率76.5%，優於第一代Claude的73%。而在GRE閱讀及作文測試中，Claude 2得分高居所有應試者的前10%，而在定量推理則約等同人類應試者中位數得分。

Anthropic說，最新一代AI聊天機器人除了提升效能，也增加輸入及輸出的長度；它每次輸入最長可接受100,000 tokens，意謂著它能讀取數百頁的技術文件甚至一本書，一次能撰寫更長的文件，包括數千tokens的筆記、信函。

Claude 2也大幅改善寫程式的能力。在Python編程測試Codex HumanEval中，Claude 2的得分由前一代的56.0%提高到71.2%。而在以小學數學問題組成的AI測試資料集GSM8k中，最新的AI聊天機器人得分由85.2%提高到88.0%。Anthropic說已擬定一份Claude 2的能力提升計畫，他們會在接下來幾個月內逐步部署。

Claude 2安全性也有所提升，這能更有效防止用戶叫它產出有害或危險的回應內容。雖然還沒有模型能完全免於被操弄、Jailbreak，但Anthropic內部用了多種安全工具及方法、人為檢查及紅隊評估工具來提升其輸出的安全性。在其紅隊評估工具中，Claude 2提供無害回應內容是Claude 1.3版的2倍。

由於安全、功能及效能有所提升，Anthropic宣布Claude 2在美國及英國開放全面公測，他們也計畫未來幾個月內再擴大測試對象。現在用戶可以先註冊帳號（https://claude.ai/），以自然語言和Claude對談牛刀小試。

Anthropic也宣布Claude 2支援以API及公開beta網站claude.ai存取。目前該公司已和數千家企業測試使用Claude API。其中一家是AI文字生成平臺Jasper及程式撰寫輔助工具Sourcegraph。Claude也是AWS AI服務Bedrock合作的AI模型之一。

熱門新聞