美國人工智慧公司 Anthropic 今日宣布推出旗下最新大型語言模型 Claude Sonnet 5。此舉正值數週前,美國政府以國家安全為由,對其更強大的模型 Fable 5 和 Mythos 5 實施禁令,凸顯 Anthropic 試圖在技術能力與監管規範之間尋求平衡。
Anthropic 執行長達里奧·阿莫代(Dario Amodei)曾形容其 Mythos Preview 為「網路超級武器」。《Techzine Global》報導指出,美國政府擔憂這類強大 AI 模型對非美國公民構成潛在威脅,已於 6 月中旬禁止非美國用戶使用 Fable 5 和 Mythos 5,並針對 Mythos 5 採行受控存取政策,由美國政府決定哪些組織獲准使用這些頂級模型。
Claude Sonnet 5 在複雜推理、工具使用、程式開發和知識工作等基準測試中,表現與其更強大的姊妹模型 Opus 4.8 幾乎不相上下。然而,Anthropic 刻意為 Sonnet 5 增加了安全防護措施,甚至比其前身 Sonnet 4.6 更為嚴格,並與 Opus 4.7 及 4.8 的防護級別一致。值得注意的是,Sonnet 5 在網路安全任務上刻意表現不佳。例如,在與 Mozilla 合作開發的測試中,Sonnet 5 始終無法成功建構出針對 Firefox 漏洞的攻擊程式,且內部稽核顯示其「錯位行為」(misaligned behavior,指模型輸出不符合預期或規範的內容)百分比高於 Opus 4.8 和 Mythos Preview。
Anthropic 為 Sonnet 5 訂定較低的定價策略,在 8 月 31 日前提供每百萬輸入 Token(AI 處理語言的最小單位)2 美元、輸出 Token 10 美元的促銷價,之後則分別調升至 3 美元與 15 美元。相較之下,Opus 4.8 的定價為每百萬輸入 Token 5 美元、輸出 Token 25 美元。Sonnet 5 今日起已成為 Anthropic 免費與專業版用戶的預設模型,並對企業客戶全面開放。Anthropic 也透過其 Claude Code 和 Claude Platform 提供 Sonnet 5 的 API 存取,並採用類似 Gemini 或 ChatGPT 的模式,將其定位於日常 AI 應用,如規劃假期等。
另一方面,OpenAI 也面臨類似挑戰,旗下 GPT-5.6 系列模型(包括類 Fable 的 Sol Ultra、類 Opus 的 Sol,以及潛在競爭 Sonnet 系列的 Terra 等)的推出受到限制。中國公司 Z.ai 推出的 GLM-5.2 模型,據稱性能與部分 Claude Opus 模型相當,且每 Token 成本較 Opus 4.8 便宜五倍,儘管其每項輸出消耗的 Token 量遠多於 Opus。
Sonnet 5 的推出,代表 Anthropic 在權衡先進 AI 能力與規避潛在監管風險之間所做的策略選擇。這款模型在提供強大功能的同時,也透過內建的安全機制與定價策略,試圖平衡其在全球 AI 競爭中的地位。


