Antropisk Claude 3.5 Sonnet vs OpenAI GPT-4o: Vilken är bättre?

Man och kvinna poserar bakom ljusorange vägg

Anthropic grundades av Dario och Daniela Amodei 2021.Artighet Anthropic.

Anthropic, en A.I. startup grundad av tidigare OpenAI-ingenjörer i går (20 juni) släppte Claude 3.5 Sonnet, dess mest kraftfulla A.I. modell ännu. Den nya modellen är inte bara dubbelt så snabb som sin föregångare, Claude 3 Opus, som släpptes för bara tre månader sedan, utan överträffar OpenAI:s GPT-4o över många resonemang, kodning och visuell förståelse, enligt företaget. Med dagens lansering tar vi ett steg mot vad vi tror kan vara en betydande förändring i hur vi interagerar med teknologi, säger Anthropics vd och medgrundare Dario Amodi i ett uttalande.

Anthropic har positionerat sig som en av OpenAI:s primära rivaler. Det grundades 2021 av Dario Amodei och hans syster Daniela. Båda har tidigare arbetat på OpenAI, respektive övervakat forskning och dess säkerhets- och policyinitiativ, och lämnade företaget 2020 över oro över dess riktning och brist på skyddsåtgärder.

Dario Amodei föreslog snabba modellsläpp inom en snar framtid. Släppet av Claude 3.5 Sonnet kommer snart att följas av nya släpp i Claude-familjen. Vårt mål är att avsevärt förbättra kompromisskurvan mellan intelligens, hastighet och kostnad, och vi planerar att släppa Claude 3.5 Haiku och Claude 3.6 Opus senare i år samtidigt som vi fortsätter vår säkerhetsforskning för att säkerställa att dessa system förblir säkra, sa VD:n. Anthropic utforskar också minnesfokuserade funktioner som ytterligare kommer att anpassa modeller för att komma ihåg specifika användarpreferenser och interaktionsfunktioner.

stjärntecken

Den San Francisco-baserade startupen har för närvarande runt 375 anställda, jämfört med OpenAI:s antal anställda på. cirka 2 000. Anthropics uppsjö av släpp tyder på att de försöker hänga med i en fartfylld A.I. kapprustning med OpenAI, som debuterade med GPT-4o i maj. Så här står de två företagets nyaste modeller mot varandra:

Claude kommer ut på toppen för läsning, kodning och matematik

Förutom att visa upp förbättringar i humor, nyanser och skrivande med en naturlig och relaterbar röst, sa Anthropic att dess senaste modell överträffar GPT-4o över riktmärken i resonemang, kunskap och kodningsförmåga.

Claude 3.5 Sonnet överträffar något GPT-4o i resonemang på forskarnivå, kod, flerspråkig matematik och resonemang över text, enligt uppstarten . GPT-4o visar samtidigt högre färdigheter i matematisk problemlösning.

"är harry" är ett bra märke

Trots Claudes imponerande resultat har A.I. modellriktmärken bör inte tas på alltför stort allvar som ett mått på förmågor till skepsis angående deras snäva fokus och oförmåga att förmedla hur genomsnittliga individer interagerar med modeller.

Överträffar GPT-4o som visuell modell

En annan serie riktmärken visar upp Claudes förbättringar inom visuell förståelse. Anthropic sa att dess nya modell överträffar GPT-4o när det gäller att visuellt förstå matematik, naturvetenskapliga diagram, diagram och dokument. Dessa funktioner är särskilt viktiga för detaljhandeln, logistik och finansiella tjänster, som ofta kan få fler insikter från en bild, grafik eller illustration än från enbart text, enligt företaget.

Antropisk uppsättning för att integrera A.I. in på arbetsplatsen

Anthropics nya modell kommer dessutom att debutera en funktion som kallas Artifacts som skiljer den från konkurrerande modeller. Det kommer att skapa en integrerad arbetsyta som tillåter användare att direkt redigera och interagera med innehåll, såsom e-post, kod eller dokument, genererat av Claude. Den nya funktionen representerar Anthropics önskan att tjäna företag genom att förvandla Claude från en konversations-A.I. till en samarbetsmiljö.

vilket stjärntecken är 28 jan

Båda modellerna finns tillgängliga utan kostnad

Webb- och appversionen av Claude 3.5 Sonnet kommer att finnas tillgänglig utan kostnad. Samtidigt kommer Claude Pro- och Team-abonnenter att få tillgång till modellen med högre prisgränser. Detta drag följer en standard satt av OpenAI, som lanserade GPT-4o tidigare i år gratis och med större möjligheter för betalande användare.

Prioritering av säkerhetsprotokoll

Claude utsattes för rigorösa säkerhetstester, enligt Anthropic, som gav modellen till Storbritanniens Artificial Intelligence Safety Institute för säkerhetsutvärderingar före utplacering. OpenAI har under de senaste månaderna kommit under beskyllning från tidigare anställda som hävdar att företaget inte är det prioritera säkerhetsprotokoll . Jan Leike, som tidigare var med och drev ett säkerhetsteam på OpenAI som sedan har upplösts, lämnade företaget i maj och har sedan dess gått med i Anthropic.

Att skapa system som inte bara är kapabla utan också pålitliga, säkra och anpassade till mänskliga värderingar är en komplex utmaning, sa Dario Amodi. Vi har inte alla svar, men vi är dedikerade till att arbeta med dessa problem eftertänksamt och ansvarsfullt