Variansanalyse (ANOVA) Forklaret på mindre end 5 minutter

Variansanalyse er en af ​​metoderne, der bruges til hypotesetestning. Metoden er medvirkende til at træffe datadrevne beslutninger i erhvervslivet.

Men ligesom de fleste begreber i matematik er det ofte omgærdet af jargon og matematisk notation, der i begyndelsen kan virke skræmmende. Denne artikel har til formål at forklare variansanalysen for dig. Så lad os komme i gang.

Introduktion til variansanalyse (ANOVA)

Før vi begynder at diskutere ANOVA, er det vigtigt at definere og forklare nogle få udtryk for at etablere et ordforråd. Så lad os starte med nogle meget vigtige udtryk: population, stikprøve, varians og hypotese.

Befolkning

I statistik er en population et helt sæt, hvorfra der kan foretages observationer. For eksempel, hvis vi ønskede at beregne den gennemsnitlige størrelse af et blad af en bestemt træart, ville populationen inkludere alle bladene fra den pågældende arts træer. Det ville dog være dyrt, hvis ikke umuligt. Så i stedet bruger vi en prøve.

Prøve

En stikprøve er en delmængde af populationen, der er repræsentativ for populationen. Derfor skal en stikprøve udvælges tilfældigt fra forskellige dele af populationen. En prøve er mere bekvem end en population, fordi der vil blive foretaget færre observationer.

Varians

Varians måler, hvor spredt værdierne i et datasæt er fra middelværdien. En lav varians betyder, at værdierne er tæt på middelværdien, mens en høj betyder, at de er spredt bredt fra middelværdien.

Hypotese

En hypotese er et udsagn lavet for at forklare noget. Der laves ingen antagelser om, hvorvidt det er sandt eller ej. I stedet er eksperimenter designet til at bevise, at det ikke vides at være falsk.

  11 Top Move To Earn (M2E) Crypto/Tokens i 2022

I ANOVA beskæftiger vi os med to slags hypoteser – nul og alternative. En nulhypotese udtrykker, at der ikke er forskel mellem grupper, mens alternativet siger, at der er. Efter testen vil vi acceptere en af ​​disse som sand.

Variansanalyse (ANOVA) er en statistisk metode, der bruges til at kontrollere, om en ændring i en uafhængig variabel resulterede i en ændring i en afhængig variabel. Det bestemmer med andre ord, om der er signifikante forskelle mellem resultaterne af forskellige uafhængige grupper.

For eksempel kan en ANOVA-test afgøre, om forskellige landingssider fik webbesøgende til at bruge mere tid på at læse din hjemmeside. I dette tilfælde vil du vise de forskellige landingssidedesigns til forskellige brugere af dit websted.

For hver session vil du registrere den tid, en bruger bruger. Til sidst vil du udføre en ANOVA-test for at se, om resultaterne af hver prøve er væsentligt forskellige fra de andre.

ANOVA er en af ​​de mange metoder, der bruges til hypotesetestning. Andre populære metoder omfatter t-test, z-test og chi-kvadrat-test. Den største forskel mellem disse tests er, hvor og hvornår de bruges.

Typer af Anova

Der findes forskellige typer ANOVA-tests. Der er en envejs test og en tovejs ANOVA test.

  • Envejstest – I en envejstest er der kun én uafhængig variabel, og vi forsøger at afgøre, om ændringer i den variabel har givet ændringer i den afhængige variabel, som er statistisk signifikante.
  • Tovejstest – I en tovejstest er der flere uafhængige variable. Denne test kaldes ofte MANOVA, hvor M står for Multiple.
  Fix Desktop Window Manager holdt op med at virke

I næste afsnit vil jeg forklare formlen for ANOVA-testen.

Formlen for ANOVA-testen

En ANOVA-test afgør, om der er signifikante forskelle mellem værdier fra forskellige grupper eller prøver. Som alle hypotesetests skal vi først etablere nul- og alternative hypoteser.

For en ANOVA-test vil nulhypotesen for denne test være, at der ikke er signifikante forskelle mellem de forskellige grupper af værdier.

Den alternative hypotese ville være, at der eksisterer signifikante forskelle mellem mindst et par grupper i datasættet.

ANOVA-formlen beregner en f-værdi. Denne værdi er et forhold mellem middelsummen af ​​kvadrater på grund af behandling (MST) og middelsummen af ​​kvadrater på grund af fejl (MSE).

F=MST/MSE

I det væsentlige repræsenterer MST variansen mellem prøvegennemsnit. Det er forskel mellem grupperne. MSE repræsenterer variansen inden for prøverne. Det er varians inden for grupper.

For at fastholde dette som en almindelig engelsk introduktion, vil jeg ikke gå yderligere ind i formlen. Dette er også unødvendigt, fordi der er software, der vil beregne ANOVA for dig.

I sidste ende, hvis resultatet af denne F-værdi er tæt på 1, så eksisterer der ingen signifikant forskel; derfor vil nulhypotesen blive accepteret. Ellers vil nulhypotesen blive forkastet.

ANOVA vs. andre tests

Som tidligere nævnt er ANOVA en metode, der bruges til hypotesetestning. Der er andre metoder, såsom t-test og z-test. Valget af test, der skal bruges i et givet scenarie, afhænger af situationen.

  • En t-test sammenligner et stikprøvemiddel med et kendt populationsmiddel, når standardafvigelsen er ukendt.
  • En z-test er som en t-test, idet den sammenligner et stikprøvemiddel med et kendt populationsmiddel. I en z-test er standardafvigelsen dog kendt.
  • En chi-kvadrattest bruges til at bestemme uafhængigheden mellem to uafhængige variable.
  En introduktion til AppleScript

Dernæst vil vi diskutere vigtigheden af ​​at analysere varianser.

Vigtigheden af ​​at analysere afvigelser

ANOVA giver os mulighed for at sammenligne gennemsnit på tværs af flere grupper eller forhold, hvilket gør det muligt at bestemme, om observerede forskelle er statistisk signifikante eller blot skyldes tilfældige tilfældigheder. Dette er afgørende på mange områder, såsom statistik, forskning og eksperimentelt design, fordi det hjælper os med at forstå kilderne til variation inden for datasæt.

At analysere varianser hjælper dig med at bestemme årsagssammenhængen mellem forskellige faktorer. Dette er vigtigt for at træffe datadrevne beslutninger og også måle fremskridt. ANOVA hjælper dig med at sammenligne på tværs af flere grupper.

Ved at dekomponere den totale varians i forskellige komponenter, der kan henføres til forskellige faktorer, gør ANOVA os i stand til at identificere, hvilke faktorer der signifikant påvirker de observerede forskelle.

Nogle af de mest almindelige anvendelsestilfælde af ANOVA er anført i næste afsnit.

Brug Cases af ANOVA

Variansanalyse er utroligt nyttigt i erhvervslivet. Det hjælper dig med at træffe bedre og mere informerede beslutninger. Nogle af de almindelige anvendelsestilfælde for ANOVA inkluderer:

❇️ Test af forskellige produktversioner for at se, hvilken version kunder bedst kan lide og er mere tilbøjelige til at købe.

❇️ At finde den mest effektive annonce til dine annoncekampagner, der vil føre til de højeste konverteringsrater.

❇️ Når du udfører markedsundersøgelser, forsøger du at afgøre, hvilke faktorer der påvirker kundernes adfærd mest.

❇️ Afprøve forskellige kundefastholdelsesstrategier for at afgøre, hvilke der fører til den laveste afgang.

❇️ Bestemmelse af de faktorer, der bidrager til og forårsager aktiemarkedskursbevægelser.

Afsluttende ord

Denne artikel tjente som en kort introduktion til ANOVA. Vi dækkede, hvad det er, dets vigtighed og tilfælde, hvor testen ville være nyttig.

Tjek derefter analyse- og forskningsværktøjer til dataforskere.