Googles Gemini AI er her, men er det bedre end ChatGPT?

Nøgle takeaways

  • Googles AI-model Gemini har tre varianter, Ultra, Pro og Nano, fokuseret på forskellige opgaver og kompleksitetsniveauer.
  • Gemini Ultra viser lovende resultater på vigtige AI-benchmarks, men fra december 2023 var den ikke tilgængelig til offentlig brug. Google siger, at den skulle være tilgængelig i januar 2024.
  • Gemini Pro er tilgængelig, og selvom den præsterer ganske godt, formår den i øjeblikket ikke at detronisere GPT-4.

Google har konsekvent lovet, at dens Gemini AI-model ville være bedre end OpenAIs GPT-4, modellen, der driver ChatGPT Plus. Nu hvor Google Gemini er lanceret, kan vi endelig afprøve det og se, hvordan Gemini kan sammenlignes med GPT-4.

Da Google lancerede Bard i marts 2023, var der mange grunde til at være begejstret. Endelig ville OpenAIs ChatGPT-monopol blive brudt, og vi ville få værdig konkurrence.

Men Bard var aldrig den AI-titan, folk håbede på, og GPT-4 er fortsat den dominerende generative AI-chatbot-platform. Nu er Googles Gemini her – men er den længe ventede AI-model bedre end ChatGPT?

Hvad er Googles Gemini AI-model?

Gemini er Googles mest dygtige generative AI-model, der er i stand til at forstå og fungere på tværs af forskellige dataformater, herunder tekst, lyd, billede og video. Det er Googles forsøg på at skabe en samlet AI-model, der tegner kapaciteter fra sine mest dygtige AI-teknologier. Gemini vil være tilgængelig i tre varianter:

  9 bedste spilserver-hostingplatforme for alle
  • Gemini Ultra: Den største og mest kapable variant designet til at håndtere meget komplekse opgaver.
  • Gemini Pro: Den bedste model til at skalere og levere høj ydeevne på tværs af en lang række opgaver, men mindre dygtig end Ultra.
  • Gemini Nano: Den mest effektive model designet til opgaveimplementering på enheden. For eksempel kan udviklere bruge Gemini Nano til at bygge mobile apps eller integrerede systemer, hvilket bringer kraftfuld AI ind i det mobile rum.
  • På sin officielle blog, Nøgleordet, siger Google, at Gemini Ultra udkonkurrerer state-of-the-art i flere benchmarks. Google hævder, at Gemini Ultra slår den brancheførende GPT-4 i flere vigtige benchmarks.

    Med en hidtil uset 90,0 % score på det strenge MMLU-benchmark siger Google, at Gemini Ultra er den første model, der overgår præstationer på menneskeligt niveau i denne mangefacetterede test, der spænder over 57 forsøgspersoner.

    Google

    Gemini Ultra kan også forstå, forklare og generere højkvalitetskode på nogle af verdens mest populære programmeringssprog, herunder Go, JavaScript, Python, Java og C++. På papiret er det alle gode resultater. Men disse er alle benchmarks, og benchmarks fortæller ikke altid hele historien. Så hvor godt klarer Gemini sig i opgaver i den virkelige verden?

    Sådan bruger du Google Gemini AI

    Af de tre varianter af Gemini AI-modellen kan du begynde at bruge Gemini Pro lige nu. Gemini Pro er i øjeblikket tilgængelig på Googles Bard-chatbot. For at bruge Gemini Pro med Bard skal du gå til bard.google.com og log ind med din Google-konto.

      Konverter MKV til MP4 med disse 11 onlineværktøjer

    Google siger, at Gemini Ultra vil rulle ud i januar 2024, så vi har måttet nøjes med at teste Gemini Pro mod ChatGPT indtil videre.

    Hvordan Gemini sammenligner med GPT-3.5 og GPT-4

    Når en ny AI-model lanceres, testes den mod OpenAIs GPT AI-modeller, som generelt accepteres som den avancerede model, som andre modeller bør holdes op imod. Så ved at bruge Bard og ChatGPT testede vi Geminis evne til matematik, kreativ skrivning, kodegenerering og nøjagtig behandling af billedinput.

    Startende med det nemmeste matematiske spørgsmål, vi kunne komme i tanke om, bad vi begge chatbots om at løse: -1 x -1 x -1.

    Bard gik først. Vi gentog spørgsmålet to gange, og alle vendte tilbage med forkerte svar. Vi fik svaret i tredje forsøg, men det tæller ikke.

    Vi prøvede ChatGPT, der kører på GPT-3.5. Den første retssag fik det rigtige.

    For at teste Geminis billedfortolkningsevner gav vi den til opgave at fortolke nogle populære memes. Det afslog og sagde, at det ikke kan fortolke billeder med mennesker i den. ChatGPT, der kører GPT-4V, var villig og i stand til at gøre det fejlfrit.

    Vi prøvede endnu et forsøg på at få det til at fortolke et billede, mens vi testede dets problemløsnings- og kodningsevne. Vi gav Bard, der kørte Gemini Pro, et skærmbillede og bad den om at fortolke og skrive HTML- og CSS-kode for at replikere skærmbilledet.

      Sådan går du inkognito på din Chromebook (3 måder)

    Her er kildens skærmbillede.

    Nedenfor er Gemini Pros forsøg på at fortolke og replikere skærmbilledet ved hjælp af HTML og CSS.

    Og her er GPT-4s forsøg på at replikere skærmbilledet. Resultatet er ikke overraskende, i betragtning af at GPT-4 historisk set har været stærk til kodning. Vi har tidligere demonstreret brugen af ​​GPT-4 til at bygge en webapp fra bunden.

    Vi bad Gemini Pro om at lave et digt om Tesla (elbilmærket). Det viste marginale forbedringer i forhold til tidligere test, vi har lavet tidligere. Her er resultatet:

    På dette tidspunkt mente vi at sammenligne resultaterne med GPT-3.5 i stedet for den superladede GPT-4 ville være mere passende. Så vi bad ChatGPT, der kører GPT-3.5, om at lave et lignende digt.

    Det kan være et personligt valg, men Gemini Pros syn på dette virker bedre. Men vi lader dig være dommeren.

    Er Gemini bedre end ChatGPT?

    Før Google lancerede Bard, troede vi, at det ville være ChatGPT-konkurrencen, vi havde ventet på – det var det ikke. Nu er Gemini her, og indtil videre virker Gemini Pro ikke som modellen til at give ChatGPT knockout-punch.

    Google siger, at Gemini Ultra bliver meget bedre. Vi håber virkelig, det er, og at det opfylder eller overstiger påstandene i Gemini Ultra-meddelelsen. Men før vi ser og tester den bedste version af Googles generative AI-værktøj, ved vi ikke, om det kan afværge andre AI-modellers konkurrenter. Som det står, forbliver GPT-4 den ubestridte AI-modelmester.