-
日期: 2024-10-04 | 來源: 量子位 | 有0人參與評論 | 專欄: 留學生 | 字體: 小 中 大
簡單來說,論文發現:更大且更遵循指令的大模型也變得更不可靠了,某些情況下 GPT-4在回答可靠性上還不如GPT-3。
與早期模型相比,有更多算力和人類反饋加持的最新模型,在回答可靠性上實際愈加惡化了。
結論一出,立即引來20多萬網友圍觀。
在Reddit論壇也引發圍觀議論。
這讓人不禁想起,一大堆專家/博士級別的模型還不會“9.9和9.11”哪個大這樣的簡單問題。
關於這個現象,論文提到這也反映出, 模型的表現與人類對難度的預期不符。
換句話說,“LLMs在用戶預料不到的地方既成功又(更危險地)失敗”。
Ilya Sutskever2022年曾預測:
也許隨著時間的推移,這種差異會減少。
然而這篇論文發現情況並非如此。不止GPT,LLaMA和BLOOM系列,甚至OpenAI新的 o1模型和Claude-3.5-Sonnet也在可靠性方面令人擔憂。
更重要的是,論文還發現依靠人類監督來糾正錯誤的做法也不管用。
有網友認為,雖然較大的模型可能會帶來可靠性問題,但它們也提供了前所未有的功能。
我們需要專注於開發穩健的評估方法並提高透明度。- 新聞來源於其它媒體,內容不代表本站立場!
- 出國學文科的留學生,如今後悔了嗎?
- 女留學生BC宿營時遇風暴不幸喪生
- 炸鍋了!特朗普發圖暗示要吞並加國
- 溫哥華牙醫 采用先進技術最新設備
- BC非法藥物死亡人數猛將 原因不明
-
- 慘!留學生在加國剛工作三天遭槍殺
- 調查: 你應該給送餐司機多少小費?
- 北極寒流將襲擊加國 大溫要下雪了
- 可怕 男子在BC省公園遭注射器刺傷
- 瓊瑤母親袁行怒:他就是想玩弄你,你能幫他賺錢,維持他的皇冠
- 家中這些物品或導致癌症和癡呆症
-
- 霉霉演唱會 粉絲透露花多錢買門票
- 中國戰狼外交的標志性人物盧沙野即將離任
- 下場太慘!港媒爆中國芯片業3項自主率
- 李嫣曬合照為王菲慶生 母女倆美得各有千秋
- 中國半導體自給自足?"純碎胡說八道"
- 美國和中國都會輸 贏的是這個大國
-
- 周潤發14年獨棟豪宅降價出售了 細節全曝光
- 工簽持有者如何利用新政提升成功移民的機會
- 又要罷工 溫機場燃油運輸大受影響
- "保姆縱火案"林生斌任職公司被列入經營異常名錄
- 19歲上海女孩美翻溫哥華! 再奪選美殊榮
- 大統華美國第一家分店已在這開業
-
目前還沒有人發表評論, 大家都在期待您的高見