-
日期: 2025-05-22 | 來源: 硅星人Pro | 有0人參與評論 | 字體: 小 中 大
Claude 4 系列還引入了“工具輔助的延伸思考”、增強的記憶能力以及正式版的編程助手 Claude Code,後者已深度集成至 VS Code 和 JetBrains IDE。在API和MCP的接入等能力上也有大范圍更新。
這是一次全方位的更新,針對編程和推理能力。而這次大更新和工具能力的補足後,Claude 4有了替代人類程序員所需要的所有條件,接下來就是一路提升這些能力,短期目標讓Agents普及,長期就直奔Anthropic眼裡的AGI了。
1
不只是模型升級,更是全面能力補足
Claude 4 的發布,並非簡單沿襲“Haiku、Sonnet、Opus”的階梯式組合,而是推出了兩大核心模型:追求極致性能的 Claude Opus 4 和兼顧效率與成本的 Claude Sonnet 4。
Anthropic 聲稱,Opus 4 是目前編程能力較為領先的模型之一。根據披露信息及早期用戶反饋,它頗有“質變”的意味,不僅編程效率提升,而且其展現出的復雜任務理解和執行能力,讓很多人“feel 到了 AGI”。
顯著提升的代碼生成與理解:Claude Opus 4 在編程基准測試 SWE-bench 上取得了 72.5% 的得分,在 Terminal-bench 上也達到了 43.2%;而 Sonnet 4 在 SWE-bench 上的得分也達到了 72.7%,接近 Opus 4 的水平。
而根據提前試用者的反饋,很多場景已經遠非生成代碼片段或輔助調試,而是能夠理解並處理數百萬行級別的復雜代碼庫,從高度抽象的自然語言需求直接生成結構完整、邏輯嚴密的應用程序框架。
Rakuten 在一項高要求的開源重構任務中,Opus 4 連續穩定運行長達 7 小時,表現出色。Cognition AI 表示,Opus 4 能解決其他模型此前無法完成的復雜任務。這種深度理解和生成能力,是構建更高級智能體的前提。
這些數據和案例表明,Claude 4 不僅僅是代碼片段的生成器,它已經具備了理解大型、復雜項目架構的能力,能夠從高層次的需求出發,生成結構完整、邏輯嚴密的應用程序。這意味著它能夠勝任從需求分析(理解自然語言需求)到代碼實現、重構乃至持續集成等傳統上由人類程序員完成的整個開發生命周期中的核心任務。這種全棧式的代碼處理能力,是替代人類程序員在日常開發工作中所需的第一塊能力。- 新聞來源於其它媒體,內容不代表本站立場!
- AI獨角獸崩塌!全是印度程序員冒充?
- 大廠程序員:AI正將我們變成高速流水線工人
- 王中磊當眾摟腰馬筱梅,汪小菲的反應太意外
- 實習醫生舉報醫院醫療腐敗後墜樓,湖南衛健委回應
-
- 溫哥華地產經紀 經驗豐富誠信可靠
- 存錢容易取錢難 中國儲戶奇葩案例令人咋舌
- 馮小剛直言:她太能裝了,永遠紅不了
- 大S珠寶終於有下落了 S媽曬出的照片暴露一切
- 100多人受傷 Costco產品緊急召回
- 加國上調通脹CPI中住房交通的權重
-
- 川普要來加拿大 不知會上演啥戲碼
- 希拉裡也發對比圖,嘲諷特朗普"低能量美式閱兵"
- 重磅!溫市府推新措施緩解開發壓力
- 南邊又亂套了!數百萬人上街反川普
- 中國將對非洲53國零關稅 毫無意義?
- 溫哥華牙醫診所 經驗豐富服務全面
-
- 若有"這狀況"、油價恐飆破每桶120美元
- 1993年,88歲的陳雲要求緊急停播一部熱映電視劇,央視:馬上停播
- 62歲李連傑的4個女兒,已經都開始為他爭光了!
- 讓伊朗拖住美國...中媒:中國需助伊朗提升戰力
- 內塔尼亞胡:如伊朗放棄核計劃,以色列願停止行動
- 活不起?一批北美陪讀媽媽加速回流…
-
目前還沒有人發表評論, 大家都在期待您的高見