【AI時(shí)刻】GPT-4最強(qiáng)對(duì)手出現(xiàn)!Claude-3 AI模型發(fā)布
就當(dāng)我們還在為OpenAI的Sora實(shí)際效果感到震撼,驚嘆未來已來的時(shí)候。短短一個(gè)月,OpenAI的“家”就被人偷了,昨晚北京時(shí)間凌晨Anthropic公司宣布Claude-3正式發(fā)布,帶有三個(gè)高性能的模型形態(tài),并宣布在AI邏輯基準(zhǔn)測(cè)試中超過了ChatGPT-4。 可能國(guó)內(nèi)的小伙伴很少知道Claude,這是一個(gè)在海外備受關(guān)注且用戶基數(shù)較大的一個(gè)AI模型,其從誕生以來就一直與GPT相愛相殺,在AI
2024-03-11 11:03:18
來源:PConline??

就當(dāng)我們還在為OpenAI的Sora實(shí)際效果感到震撼,驚嘆未來已來的時(shí)候。短短一個(gè)月,OpenAI的“家”就被人偷了,昨晚北京時(shí)間凌晨Anthropic公司宣布Claude-3正式發(fā)布,帶有三個(gè)高性能的模型形態(tài),并宣布在AI邏輯基準(zhǔn)測(cè)試中超過了ChatGPT-4。

可能國(guó)內(nèi)的小伙伴很少知道Claude,這是一個(gè)在海外備受關(guān)注且用戶基數(shù)較大的一個(gè)AI模型,其從誕生以來就一直與GPT相愛相殺,在AI性能排行榜上緊追不舍。其也是基于GPT(Generative Pre-trained Transformer)技術(shù)的大型語言模型,通過在大規(guī)模文本數(shù)據(jù)上的預(yù)訓(xùn)練,學(xué)會(huì)了自然語言理解和生成的能力。

亞馬遜于今日宣布使用Claude3來優(yōu)化其商業(yè)邏輯

該系列包含三款各具特色的型號(hào):Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它們?cè)谛阅芘c應(yīng)用功能上各有側(cè)重,旨在滿足多樣化的應(yīng)用場(chǎng)景需求。

Claude 3 Haiku

Haiku 型號(hào)憑借其極速處理能力和高性價(jià)比脫穎而出。它能夠在短短三秒內(nèi)完成對(duì)一篇含有約 10,000 個(gè)標(biāo)記、信息濃縮且數(shù)據(jù)密集的 arXiv 研究論文的閱讀工作,包括對(duì)圖表和圖形的理解。Haiku 尤其適用于那些對(duì)處理速度有極高要求但性能負(fù)荷相對(duì)較輕的平臺(tái)。

Claude 3 Sonnet

Sonnet 型號(hào)在處理大多數(shù)工作負(fù)載時(shí)的速度是 Claude 2 以及 Claude 2.1 的兩倍,且模型效果與性能一致,并提供更高層次的智能分析能力。它特別擅長(zhǎng)處理那些需要快速反應(yīng)的任務(wù),例如知識(shí)檢索和銷售流程自動(dòng)化等。

Claude 3 Opus

Claude 3 Opus 是系列中的高端型號(hào),具備與市場(chǎng)上其他頂尖模型相匹敵的復(fù)雜視覺處理能力,能夠處理多種視覺格式,包括照片、圖表、圖形以及技術(shù)圖解。相較于 Claude 2.1,Opus 在解決開放性問題上的準(zhǔn)確度提升了一倍,同時(shí)也顯著降低了錯(cuò)誤答案的比例。

其他亮點(diǎn)

全系列模型均能處理超過 100 萬個(gè)標(biāo)記的輸入,為那些需要更強(qiáng)大處理能力的客戶提供可靠支持。Claude 3 系列在執(zhí)行復(fù)雜多步驟指令方面表現(xiàn)卓越,尤其在遵循品牌語調(diào)和響應(yīng)指南上,能夠?yàn)橛脩舸蛟斐鲋档眯刨嚨目蛻趔w驗(yàn)。此外,這些模型還擅長(zhǎng)生成流行的結(jié)構(gòu)化輸出格式,如 JSON。

目前,Opus 和 Sonnet 已經(jīng)通過 API 對(duì)外開放,開發(fā)者現(xiàn)可直接注冊(cè)并開始體驗(yàn)這些尖端模型的強(qiáng)大功能。比如,POE就已經(jīng)支持Claude-3-Opus模型,購(gòu)買POE“月卡”后就可以體驗(yàn)。

超越GPT-4;兼顧視覺功能

根據(jù)Anthropic的說法,Claude 3 Opus 在10項(xiàng)人工智能標(biāo)準(zhǔn)測(cè)試中超越了GPT-4,包括MMLU(本科水平知識(shí))、GSM8K(小學(xué)數(shù)學(xué))、HumanEval(編程)以及HellaSwag(常識(shí))。

其中一些勝利的優(yōu)勢(shì)非常微小,例如Opus在MMLU五次嘗試中得到86.8%的得分,而GPT-4得到86.4%,一些差距則較大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。這可能就意味著Claude 3對(duì)于新手碼農(nóng)要更加友好。

與前代模型相比,Claude 3系列在分析、預(yù)測(cè)、內(nèi)容創(chuàng)作、代碼生成以及多語言對(duì)話等方面展現(xiàn)了改進(jìn)。據(jù)報(bào)道,這些模型還具備了增強(qiáng)的視覺能力,允許模型處理照片、圖表和圖解等視覺格式,類似于GPT-4V和谷歌的Gemini

在實(shí)際測(cè)試中,Claude 3相比于GPT-4V對(duì)于PDF的解讀要更加快速,同時(shí)對(duì)于中文輸出的邏輯與優(yōu)化也要明顯好于前代,也是達(dá)到了GPT-4平替的水準(zhǔn)。

原創(chuàng)文章
最新文章
1
極米R(shí)S 20系列:用無損4K與沉浸式游戲體驗(yàn)開啟家庭娛樂新紀(jì)元
2
2025慕尼黑光伏展上,華寶新能新一代家庭綠電系統(tǒng)如何贏得全球矚目?
3
全域出擊,引爆618,磁力金牛618活動(dòng)玩法來襲,預(yù)熱會(huì)場(chǎng)即將上線
4
快手電商商家大會(huì)達(dá)人分論壇探索私域新增量,多種方式加速新達(dá)人成長(zhǎng)
5
快手本地生活“五一”假期GMV同比增長(zhǎng)108%,新線城市消費(fèi)力爆發(fā)
6
2025年一季度電視銷售額規(guī)模同比增長(zhǎng)3.4%,高端品質(zhì)化提速
7
分拆安得智聯(lián)“赴港”,美的在下一盤什么棋?
8
不卷了?美的海信攜手 友商變伙伴!
9
中國(guó)客廳最貴智能設(shè)備!閨蜜機(jī)銷量大漲超42%
10
國(guó)內(nèi)監(jiān)控?cái)z像頭第一季度銷量如何 小米成電商霸主 銷量、銷額雙第一!
11
史無前例!曝折疊屏iPhone首發(fā)三星全新面板:折痕幾乎不可見
12
把家打造成超級(jí)玩家基地!Vidda貼貼壁紙電視和C3系列投影發(fā)布
13
100英寸電視銷量暴增150%,成為電視行驅(qū)動(dòng)換新的主力軍
14
realme概念機(jī)搭載10000毫安時(shí)電池,充電寶可能要退役了?!
15
內(nèi)銷承壓之下,小家電企業(yè)押注出海能翻盤嗎?
16
技術(shù)、國(guó)補(bǔ)雙軌并行,智能馬桶行業(yè)迎來結(jié)構(gòu)性增長(zhǎng)黃金期
17
蘋果高管:10年后你可能不需要iPhone了
18
聯(lián)想moto razr 60 Ultra國(guó)行今天發(fā)布:首款驍龍8至尊版小折疊
19
全球最薄驍龍8至尊版旗艦!三星Galaxy S25 Edge官宣
20
快手電商在鄭州舉辦新商培訓(xùn)會(huì),助力服裝檔口商家開拓新渠道
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512