Hvad er Claude 3, og hvad kan du gøre med det?

Indholdsfortegnelse

hurtige links

Hvad kan du gøre med Claude 3?

Nøgle takeaways

Claude 3 fra Anthropic giver et betydeligt spring fra Claude 2 og overgår GPT-4 i forskellige opgaver.
Med Claude 3 kan du generere svar på en række forespørgsler på tværs af forskellige felter, alt sammen uden et abonnementsgebyr.
Claude 3 konkurrerer godt med ChatGPT’s GPT-4 og udmærker sig inden for områder som programmeringsopgaver, kreativ skrivning og kontekstvinduesstørrelse.

Anthropic har annonceret udgivelsen af Claude 3 – en familie af AI-modeller med potentiale til at forstyrre GPT-4. Det har enestående potentiale, men er det klar til at tage ChatGPTs krone?

Hvad er Claude 3?

Claude 3 er en familie af tre multimodale AI-modeller udviklet af Anthropic til at erstatte deres Claude 2-serie af AI-modeller. Man kan sige, at Claude 3 er Anthropics svar på Googles Gemini og OpenAIs GPT-4. Udgivet i tre versioner, Haiku, Sonnet og Opus, i deres stigende intelligensrækkefølge, er Claude 3 Anthropics første multimodale AI-model og repræsenterer et betydeligt spring fra Claude 2-serien.

Nu, hvis du aldrig har hørt om Claude AI chatbot, er det forståeligt. Claude og dens underliggende modeller nyder ikke ChatGPTs superstjernestatus eller Googles Geminis varemærkeappel. Claude er dog utvivlsomt en af de mest avancerede AI-chatbots i verden, der overgår den meget roste ChatGPT på flere nøgleområder.

For virkelig at værdsætte Claude 3, er det vigtigt at se tilbage på fejlene i de tidligere modeller.

Tidligere gentagelser af Claude havde ry for en overivrig tilgang til AI-sikkerhed. Claude 2 sikkerhedsfunktioner, for eksempel, var så stramme, at chatbot ville undgå for mange emner, selv dem uden klare sikkerhedsproblemer.

Der var også problemer med modellens kontekstvindue. Når du beder en AI-model om at forklare noget eller f.eks. opsummere en lang artikel, så forestil dig, at den kun kan læse nogle få afsnit af artiklen ad gangen. Denne grænse for, hvor meget tekst den kan tage i betragtning ad gangen, kaldes “kontekstvinduet”. Tidligere versioner af Claude kom med et 200.000 token (svarende til 150.000 ord) kontekstvindue. Men modellen var ikke i stand til praktisk talt at håndtere så meget tekst på en gang uden at glemme bidder af den.

Der var også spørgsmålet om multimodalitet. Næsten alle større AI-modeller er blevet multimodale, hvilket betyder, at de kan behandle andre former for data som billeder og reagere på disse data (i stedet for blot tekstinput). Claude var ikke i stand til det.

12 bedste elektriske skateboards, du bør få lige nu

Alle tre problemer er nu helt eller i det mindste delvist løst med udgivelsen af Claude 3.

Hvad kan du gøre med Claude 3?

Ligesom de fleste banebrydende generative AI-modeller derude, kan Claude 3 generere top-notch-svar til forskellige forespørgsler på tværs af forskellige felter. Uanset om du har brug for et hurtigt algebraproblem løst, en helt ny sang skrevet, en dybdegående artikel udarbejdet, kode skrevet til software eller et massivt datasæt analyseret, passer Claude 3 regningen.

Men de fleste AI-modeller er allerede gode til disse opgaver, så hvorfor bruge Claude 3?

Svaret er enkelt; Claude 3 er ikke bare endnu en AI-model, der er god til disse opgaver, det er den mest avancerede frit tilgængelige multimodale AI-model, du kan få overalt på internettet. Ja, der er Gemini, Googles meget hypede, formodede GPT-4-dræber, der præsterer imponerende i benchmark-tests. Anthropic hævder dog, at Claude 3 overgår det med en imponerende margin på flere opgaver. Mens benchmark-resultater er noget, vi ofte bør tage med et gran salt, satte jeg begge AI-modeller på prøve, og Claude 3-modellens overlegenhed i flere vigtige brugssager var meget tydelig.

Så Claude 3 lader dig gøre de fleste af de ting, du kan gøre med Gemini og GPT-4 (minus billedgenerering) uden at skulle betale abonnementsgebyret på $20 for ChatGPT premium.

Claude 3 vs. ChatGPT

En hurtig måde at teste ydeevnen af en AI-model på er at tjekke, hvor godt den kan sammenlignes med de bedste på markedet: GPT-4. Jeg satte selvfølgelig begge modeller på prøve; Hvor godt står Anthropics Claude 3 op mod den kolossale GPT-4?

Claude vs. ChatGPT: Kodningsfærdigheder

Startende med en række programmeringsopgaver matchede Claude 3 GPT -4’s evner i alle de præsenterede grundlæggende programmeringsopgaver og overgik den endda i nogle. Mens jeg kun testede det grundlæggende, var den tidligere version af Claude bemærkelsesværdigt mindre dygtig til de samme opgaver, da vi testede den i denne ChatGPT vs. Claude-sammenligning i september 2023. For eksempel, da vi bad begge modeller om at bygge en enkel opgave liste-appen fejlede Claude i alle tilfælde, mens ChatGPT satte op, hvad vi ville kalde en femstjernet forestilling på det tidspunkt.

Sådan får du portrættilstand på en ikke-understøttet iPhone

Med den seneste udgivelse producerede Claude 3 en app med bedre ydeevne i alle tre tilfælde, vi testede. Her er GPT-4’s resultat, når du bliver bedt om at oprette en opgaveliste-app.

Og her er Claude 3’s resultat, da han blev bedt om at gøre det samme.

Begge apps var funktionelle til en vis grad, men det er klart, at Claude 3 gjorde et bedre stykke arbejde med denne.

Efter at have prøvet mere komplekse programmeringstests var Claude den bedre model i flere tilfælde, mens GPT-4 også havde sine sejre. Selvom jeg ikke endegyldigt kan sige, at Claude 3 er bedre til at programmere logik, hvis der var en enorm kløft mellem de to modeller, ville den kløft næsten helt sikkert være blevet mindre.

Claude vs. ChatGPT: Sund fornuft ræsonnement

Jeg gik videre for at teste begge modeller på sund fornuft ræsonnement. At arbejde med AI-chatbots er et interessant paradoks. AI chatbots kan håndtere komplekse opgaver med lethed, men kæmper ofte med grundlæggende problemer, der kræver sund fornuft eller logik. Så vi gav begge modeller en række tilsyneladende ligetil spørgsmål, som krævede sund fornuft for at svare korrekt.

Af fem sådanne spørgsmål besvarede begge modeller alle fem logisk. Vi stillede begge chatbots et sådant spørgsmål: Hvis et rumskib fra Mars bryder i to, hvor den ene del styrter ned i Atlanterhavet nær Brasilien og den anden i Stillehavet nær Japan, hvor begraver man så de overlevende?

ChatGPT svarede korrekt selv uden GPT-4. Hvis du undrer dig over årsagen til valget af spørgsmål, ja, chatbots har historisk set fejlet dybt ved denne form for spørgelinje. Dernæst var det Claudes tur til at svare.

Claudes svar var ikke ligefrem et endegyldigt svar, men det var i stand til at identificere nøgleoplysningerne; man begraver ikke overlevende. Det er vigtigt at bemærke, at sidste gang vi stillede Claude 2 det samme spørgsmål, var det ikke i stand til at gennemskue den sunde fornuftsfælde.

Hvordan kan du fjerne en linje fra din Verizon-plan

Claude vs. ChatGPT: Kreativ skrivning

I den virkelige verden er en af de mest populære anvendelsesmuligheder for AI-chatbots at generere kreativ tekst i alle former: artikler, breve, sangtekster, you name it. Så jeg testede begge modeller for at afgøre, hvilken der skaber bedre menneskelignende tekst.

Tanken er, at resultaterne ikke bare skal være “korrekte” eller kreative (på en robotagtig måde), men lyde, som om de var skrevet af et menneske. Jeg gav begge modeller til opgave at komponere teksten til en rapsang om at dyrke agurker og blive millionær af dem. Hvem skriver rapsange om agurker? Det er ideen – noget udfordrende!

Her er ChatGPTs bud:

Og her er Claudes svar, ved at bruge den samme prompt.

Det kan være subjektivt, men Claude ser ud til at være den bedre mulighed her. Da begge værktøjer fik til opgave at udarbejde tre artikler om forskellige emner, gav Claude den bedre mulighed i alle tre tilfælde. Det gav et mere menneskelignende resultat og undgik mønstre, der almindeligvis forbindes med AI-genererede tekster, såsom overdrivelser, brugen af komplekse ord og sporadisk brug af linkord.

Claude vs. ChatGPT: Billedgenkendelsesevner

For at teste billedgenkendelsesevner fodrede vi ChatGPT og Claude med flere billeder af populære høje bygninger rundt om i verden. ChatGPT identificerede alle 20 korrekt, mens Claude 3 ikke kunne identificere nogle, inklusive den ret populære Dubais Marina 101, Lotte World Tower i Seoul og Merdeka 118-bygningen i Kuala Lumpur, Malaysia.

I modsætning til ChatGPT kæmpede Claude med at identificere blandt andet bygninger, og fejlraten steg, hvis bygningen ikke var i USA eller Kina. Det havde dog ingen problemer med at identificere slørede versioner af Eiffeltårnet eller Empire State Building.

ChatGPT er klart bedre til dette, men i betragtning af at Claude 3 er Anthropics første forsøg på at bygge en multimodal AI-model, var det ikke en dårlig udflugt.

Selvom store navnemodeller som Googles Palm 2 og efterfølgende Gemini altid er blevet udråbt som potentielle GPT-4-dræbere, har vi konsekvent fastholdt, at den mindre kendte Claude AI sandsynligvis vil have den ære siden den første udgivelse i marts 2023 Efter et par måneder og adskillige gentagelser langs linjen, ser Claude 3 ud nøjagtigt som den GPT-4-morder, vi havde forventet. Hvis du er en tung chatbot-bruger, men ikke har prøvet Claude AI-chatbot, går du glip af et enormt indflydelsesrigt AI-værktøj, der kan øge din produktivitet.