| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

能連幹30多個小時,史上最卷AI誕生


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
論卷編程,還得看 Claude。


就在剛剛,Anthropic 正式發布 Claude Sonnet 4.5。

先說 Claude Sonnet 4.5 交出的成績單,在考察真實編程水平的 SWE-bench Verified 測試裡,Claude Sonnet 4.5 直接登頂業界第一。


更離譜的是,它能連續專注幹活超過 30 小時。

好好好,AI 取代人類的優勢又 +1 了。

比如讓它寫個類似 Slack 或 Teams 的聊天應用,它能一口氣敲出大約 1.1 萬行代碼。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能獨立工作七小時。

用 Anthropic 的話來說,Claude Sonnet 4.5 現在就是全球最強編程模型——構建復雜智能體、操作電腦、推理和數學,各項能力都狠狠提升了一波。

比方說,在 OSWorld 這個專門測試真實計算機任務的基准裡,它拿下了 61.4% 的成績,直接第一。要知道,四個月前 Sonnet 4 還以 42.2% 的成績遙遙領先,這才多久性能就又往上抬了一大截。




而 Anthropic 的 Claude Chrome 插件甚至能直接在瀏覽器裡自己導航網站、填表格、處理任務,像個真人在操作似的。推理、金融這些測評項目上也都更強了,各項指標都在往上漲。



有了這麼強的能力,Anthropic 這次自然不會只發個模型就完事。




具體來看:

Claude Code加了“檢查點”功能,能隨時保存進度,想回退到之前某個狀態一鍵搞定

終端界面翻新,還發布了原生 VS Code 插件

Claude API 增加了上下文編輯功能和記憶工具
覺得新聞不錯,請點個贊吧     好新聞沒人評論怎麼行,我來說幾句
上一頁123下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0337 秒 and 5 DB Queries in 0.0039 秒