MidJourney vs. Stable Diffusion vs. Bing Image Creator

Kunstig intelligens ændrer kunstverdenen på bemærkelsesværdige måder. En af de fascinerende anvendelser af kunstig intelligens i kunstsegmentet er gennem brugen af ​​beskrivende kunstgeneratorer. Disse generatorer har evnen til at undersøge og fortolke billeder og generere helt nye kunstværker baseret på deres analyse.

I denne artikel diskuterer vi tre sådanne AI-kunstgeneratorer: MidJourney, Stable Diffusion og Microsoft Bing Image Creator, og som blandt de tre kommer ud i toppen i at generere de bedste resultater baseret på prompter.

MidJourney

MidJourney, grundlagt af David Holz, er en kunstig kunstgenerator, der bruger maskinlæring til at identificere mønstre og funktioner i eksisterende kunstværker, som derefter kan bruges til at skabe nye værker.

  GetUpside-kampagnekode til eksisterende brugere: Indløs nu

MidJourney gik ind i åben beta den 12. juli 2022. Før lanceringen af ​​MidJourney var Holz med til at stifte Leap Motion, en startup, der forvandlede brugergrænseflader ved at bruge videooptagelse og håndbevægelser. I 2019 solgte han Leap Motion til Ultrahaptics.

Med MidJourney vinder popularitet, har Holz delt sin indsigt i teknologi og dens indflydelse på kunst og samfund. Holz betragter kunstnere som kunder hos MidJourney, ikke konkurrenter, og mener, at platformen kan facilitere større kreativitet og eksperimentering i idéfasen.

Der er dog bekymringer om potentiel krænkelse af ophavsretten fra MidJourneys træningssæt, som kan omfatte ophavsretsbeskyttede værker fra andre kunstnere.

Holz understreger, at MidJourney er designet til at forbedre menneskelige evner i stedet for at erstatte dem. Han sammenligner det med biler og forklarer, at bare fordi biler er hurtigere end mennesker, betyder det ikke, at vi skal skære vores ben af.

Ved at bruge MidJourneys AI-billedgenerering kan kunstnere udforske nye muligheder og generere adskillige ideer, før de skaber deres egne værker.

  9 Tale til tekst-løsninger til personlig og erhvervsmæssig brug

Stabil diffusion

Stable Diffusion er en open source-maskinelæringsmodel, der kan generere billeder fra tekst, ændre billeder baseret på tekst eller udfylde detaljer på billeder med lav opløsning eller lavt detalje. Det er blevet trænet på milliarder af billeder og kan producere resultater, der er sammenlignelige med dem, du ville få fra DALL-E 2 og MidJourney.

Emad Mostaque, grundlægger og administrerende direktør for Stability AI, er virksomheden, der er ansvarlig for Stable Diffusion. Stable Diffusion er en latent diffusionsmodel udviklet af CompVis-gruppen ved LMU München, og den er designet af Patrick Esser og Robin Rombach, som tidligere har skabt den latente diffusionsmodel-arkitektur, der blev brugt af Stable Diffusion.

Et samarbejde mellem Stability AI, CompVis LMU, Runway, EleutherAI og LAION har gjort Stable Diffusion tilgængelig for offentligheden.

Stabil spredning kan implementeres på forskellige platforme, herunder Windows- og Apple-enheder. Brug af implementering på enheden i en app kan beskytte brugernes privatliv, hvilket er at foretrække frem for en serverbaseret tilgang.

Microsoft Bing Image Creator

Microsoft afslørede et nyt værktøj kaldet Bing Image Creator, som giver brugerne mulighed for at skabe deres egne billeder direkte i Microsoft Edge. Virksomheden har udgivet en række skaberværktøjer designet til at tænde kreativitet og selvudfoldelse. Værktøjet giver brugerne mulighed for at lave personlige billeder for at dele deres livsopdateringer eller til ethvert andet formål, de måtte have brug for.

  Sådan håndhæves multifaktorgodkendelse for alle brugere af dit Office 365-abonnement

Brugere kan nemt få adgang til Image Creator fra sidebjælken i Microsoft Edge. Microsoft har truffet proaktive foranstaltninger for at sikre, at værktøjet bruges ansvarligt og ikke letter spredningen af ​​stødende indhold.

Virksomheden har fastsat en indholdspolitik, der forbyder brugen af ​​Image Creator i visse tilfælde, og brugere kan rapportere enhver overtrædelse af denne politik. Desuden har Microsoft implementeret teknologi for at imødegå potentielle skævheder, der kunne opstå i generativ billedteknologi.

I denne artikel vil vi påbegynde en rejse for at evaluere resultaterne af hver enkelt beskrivende AI-billedgenerator, når du bliver bedt om det med identiske tekstprompter.

Opfordring 1: Moderne julemand på en slæde, der trækkes af rensdyr på en varm lys solskinsdag på en motorvej

Prompt 2: Et nærbillede af et dyr med store øjne, der fanger dets uskyld og nuttet

Prompt 3: En menneskelig astronaut, der spiller landing af en ny planet, er velkommen af ​​fjendtlige fremmede væsner, der trækker deres våben

Prompt 4: Moderne abstrakt kunst af et bogomslag til en roman baseret i New York City i dristige lyse farver

Opfordring 5: En mand, der vælger mellem to tallerkener – en med pizza og en med en cheeseburger på

Opfordring 6: En såret kriger rider på sin hest på et snedækket bjerg med et sværd i hånden

Prompt 7: Et abstrakt billede med forskellige nuancer, der viser vandets bevægelse og strømning

Prompt 8: Laks i en flod med frodige grønne træer i baggrunden

Opfordring 9: Et glas vand på et bord med en citron, der presses ind i det med en hånd

Prompt 10: Udsigt over horisonten i en ørken set fra personer, der rider på en elefant i den

Opfordring 11: En skov, hvor papirpenge vokser på træer, og fugle er lavet af mønter

Prompt 12: Skål med ramen, cel shading, aftenbelysning, fotorealistisk

Prompt 13: Elon Musk er fattig og arbejdsløs

Dom

Efter at have evalueret output fra MidJourney, Stable Diffusion og Bing Image Creator, er det tydeligt, at der ikke er nogen endelig vinder.

Hver generator fortolker prompter på en karakteristisk måde, med ligheder fundet i output fra Bing Image Creator og MidJourney. Stabil diffusion er effektiv, når prompter har klare beskrivelser, men ofte tager ord for bogstaveligt. Mens MidJourney og Bing Image Creator generelt er vellykkede, producerer de nogle gange resultater, der ikke svarer til anvisningerne.

Bing Image Creator udviser især forsigtighed ved at generere misbrug eller inciterende output og udsender en advarselsmeddelelse, når han bliver bedt om at skabe et billede af en fattig og arbejdsløs Elon Musk. Microsofts vedtagelse af sådanne beskyttelsesforanstaltninger er prisværdigt.

I mellemtiden genererede MidJourneys neurale netværksekspertise et billede af en nødlidende og forladt Elon Musk. Derfor kan det konkluderes, at hver generator vil henvende sig til sin respektive brugerbase.