-
日期: 2025-05-22 | 來源: 硅星人Pro | 有0人參與評論 | 字體: 小 中 大
Claude 4 系列還引入了“工具輔助的延伸思考”、增強的記憶能力以及正式版的編程助手 Claude Code,後者已深度集成至 VS Code 和 JetBrains IDE。在API和MCP的接入等能力上也有大范圍更新。
這是一次全方位的更新,針對編程和推理能力。而這次大更新和工具能力的補足後,Claude 4有了替代人類程序員所需要的所有條件,接下來就是一路提升這些能力,短期目標讓Agents普及,長期就直奔Anthropic眼裡的AGI了。
1
不只是模型升級,更是全面能力補足
Claude 4 的發布,並非簡單沿襲“Haiku、Sonnet、Opus”的階梯式組合,而是推出了兩大核心模型:追求極致性能的 Claude Opus 4 和兼顧效率與成本的 Claude Sonnet 4。
Anthropic 聲稱,Opus 4 是目前編程能力較為領先的模型之一。根據披露信息及早期用戶反饋,它頗有“質變”的意味,不僅編程效率提升,而且其展現出的復雜任務理解和執行能力,讓很多人“feel 到了 AGI”。
顯著提升的代碼生成與理解:Claude Opus 4 在編程基准測試 SWE-bench 上取得了 72.5% 的得分,在 Terminal-bench 上也達到了 43.2%;而 Sonnet 4 在 SWE-bench 上的得分也達到了 72.7%,接近 Opus 4 的水平。
而根據提前試用者的反饋,很多場景已經遠非生成代碼片段或輔助調試,而是能夠理解並處理數百萬行級別的復雜代碼庫,從高度抽象的自然語言需求直接生成結構完整、邏輯嚴密的應用程序框架。
Rakuten 在一項高要求的開源重構任務中,Opus 4 連續穩定運行長達 7 小時,表現出色。Cognition AI 表示,Opus 4 能解決其他模型此前無法完成的復雜任務。這種深度理解和生成能力,是構建更高級智能體的前提。
這些數據和案例表明,Claude 4 不僅僅是代碼片段的生成器,它已經具備了理解大型、復雜項目架構的能力,能夠從高層次的需求出發,生成結構完整、邏輯嚴密的應用程序。這意味著它能夠勝任從需求分析(理解自然語言需求)到代碼實現、重構乃至持續集成等傳統上由人類程序員完成的整個開發生命周期中的核心任務。這種全棧式的代碼處理能力,是替代人類程序員在日常開發工作中所需的第一塊能力。- 新聞來源於其它媒體,內容不代表本站立場!
- AI獨角獸崩塌!全是印度程序員冒充?
- 大廠程序員:AI正將我們變成高速流水線工人
- 溫哥華牙醫 采用先進技術最新設備
- 他是袁世凱之孫,被迫入美國籍,晚年為祖國奔波
- 大溫這大火濃煙滾滾 警方持槍到場
-
- 5000萬婚禮後未領證?竇驍被何超蓮家族踢出局,豪門婚姻終成笑話
- 溫哥華警方在這兒部署多個攝像頭
- 宛如酷夏 BC周日打破多項高溫紀錄
- 《藏海傳》後,2部大劇接檔,央視領銜影帝坐鎮,又有大劇能看了
- 媽媽的幸運數字讓加國男子中大獎
- 喬布斯生前最寵愛美貌小女兒大婚在即 坐擁萬億遺產
-
- 鋁鋼關稅翻倍 加國新車價格要上漲
- 加拿大房屋downsize 這些麻煩必知
- 社區女書記開車追攆女子撞傷2人被刑拘,警方通報
- 引起眾怒!"不務正業"的岳雲鵬遭到全網抵制
- 哇唧唧哇八周年:繼續讓有趣的年輕人被看到 | 對話哇唧制作總裁馬昊
- 60歲蔣雯麗現狀:定居英國,又瘦又老
-
- 太糟糕了!加國貿易逆差創歷史新高
- 對峙僵局再升溫 白宮公告列出哈佛種種罪狀
- 郭聲琨女婿升官 張又俠加強掌控軍權
- 高考影視劇:從《最好的我們》到《忽而今夏》,誰的DNA動了
- 溫哥華牙醫診所 經驗豐富服務全面
- 做對這3件事 白頭發還能"黑回去"?
-
目前還沒有人發表評論, 大家都在期待您的高見