Anthropic
AI新創公司Anthropic在5月介紹AI聊天機器人Claude,而短短2個月內,又在本周宣布更新到第2代,提升效能及安全性,加入以公開網頁及API存取的介面,也將公測對象推到美、英兩國用戶。
Anthropic指出,測試第一代Claude的用戶反映Claude很好聊、能清楚解釋其思路,較不會提供有害回應,記憶力也較長久。而第二代Claude則大幅強化程式撰寫、數學及推理能力。例如它在律師考試的多選題得分率76.5%,優於第一代Claude的73%。而在GRE閱讀及作文測試中,Claude 2得分高居所有應試者的前10%,而在定量推理則約等同人類應試者中位數得分。
Anthropic說,最新一代AI聊天機器人除了提升效能,也增加輸入及輸出的長度;它每次輸入最長可接受100,000 tokens,意謂著它能讀取數百頁的技術文件甚至一本書,一次能撰寫更長的文件,包括數千tokens的筆記、信函。
Claude 2也大幅改善寫程式的能力。在Python編程測試Codex HumanEval中,Claude 2的得分由前一代的56.0%提高到71.2%。而在以小學數學問題組成的AI測試資料集GSM8k中,最新的AI聊天機器人得分由85.2%提高到88.0%。Anthropic說已擬定一份Claude 2的能力提升計畫,他們會在接下來幾個月內逐步部署。
Claude 2安全性也有所提升,這能更有效防止用戶叫它產出有害或危險的回應內容。雖然還沒有模型能完全免於被操弄、Jailbreak,但Anthropic內部用了多種安全工具及方法、人為檢查及紅隊評估工具來提升其輸出的安全性。在其紅隊評估工具中,Claude 2提供無害回應內容是Claude 1.3版的2倍。
由於安全、功能及效能有所提升,Anthropic宣布Claude 2在美國及英國開放全面公測,他們也計畫未來幾個月內再擴大測試對象。現在用戶可以先註冊帳號(https://claude.ai/),以自然語言和Claude對談牛刀小試。
Anthropic也宣布Claude 2支援以API及公開beta網站claude.ai存取。目前該公司已和數千家企業測試使用Claude API。其中一家是AI文字生成平臺Jasper及程式撰寫輔助工具Sourcegraph。Claude也是AWS AI服務Bedrock合作的AI模型之一。
熱門新聞
2024-12-10
2024-12-10
2024-12-11
2024-12-08
2024-12-10
2024-11-29