Ny til Power BI eller vil du vide det bedre? Du bør starte med datamodellering i Power BI og derefter arbejde dig igennem datamining og til sidst udtrække handlingsorienteret indsigt fra Power BI-rapporter.
Datamodellering er kernen i ethvert dataanalyseprojekt. Det forbliver under de faktiske datavisualiseringer og dashboards, som det generelle publikum ser.
Ligesom ethvert andet dataanalyseværktøj, Power BI har også brug for datamodellering i backend til dataintegration, datatransformation, skabelse af relationer mellem forskellige tabeller i inputdatasættet, tilføjelse af beregninger og så videre.
Fortsæt med at læse for at lære alt, hvad du har brug for at vide om datamodellering i Power BI, inklusive ubesværet trin-for-trin vejledning i, hvordan du opretter en Power BI-datamodel.
Indholdsfortegnelse
Hvad er datamodellering?
I datamodellering opretter du en forenklet repræsentation af datastrukturer, relationer og attributter ved at sammenkæde de underliggende blokke af datasæt som tabeller, rækker, kolonner osv.
Det hjælper med at organisere og forstå data til effektiv lagring, hentning og analyse. Backend-datamodellen hjælper med at designe databaser, software og systemer.
Datamodellering involverer at identificere enheder, definere deres egenskaber og vise, hvordan de forbinder med hinanden for at generere mønstre og handlingsorienteret indsigt. Det er afgørende for dataanalyse, sikring af datanøjagtighed og understøttelse af beslutningsprocesser.
Hvor vigtigt det er for dataanalyse i Power BI
Datamodellering spiller en central rolle i dataanalyseværktøjer som Power BI. Dette business intelligence-værktøj er afhængig af velstrukturerede datamodeller til at skabe meningsfulde visualiseringer og indsigt.
Ved at bruge datamodelleringsprincipper kan du effektivt forbinde, transformere og visualisere data fra flere kilder inden for et stort datasæt. Datamodellering i Power BI hjælper dig også med at sikre, at de data, der præsenteres i disse analyseværktøjer, er nøjagtige og relevante
Endelig letter det informeret beslutningstagning og frigør det fulde potentiale af datadrevet indsigt. I bund og grund fungerer det også som grundlaget, hvorpå kraftfulde dataanalyseværktøjer som Power BI kan levere værdifuld forretningsintelligens.
Typer af datamodellering
#1. Konceptuel datamodellering
Det fokuserer på det store billede af dataene. Så konceptuel modellering repræsenterer data på et højt niveau uden at overveje specifikke databasestrukturer eller tekniske detaljer. Dette koncept hjælper med at afstemme data med organisatoriske mål og hjælper interessenter med at forstå dataens formål og betydning.
#2. Fysisk datamodellering
Når du modellerer dit datasæt baseret på det tekniske implementeringsaspekt til lagring og hentning, er det fysisk datamodellering. Den specificerer de datalagringsstrukturer, såsom tabeller, indekser og begrænsninger, som du kan bruge i et databasesystem.
#3. Logisk datamodellering
Logisk datamodellering bygger bro mellem konceptuel og fysisk modellering. Sådan modellering tjener som en blueprint for databasedesign og letter kommunikationen mellem forretningsinteressenter og tekniske teams, samtidig med at dataintegritet og konsistens bevares.
Datamodelleringsteknikker i Power BI
#1. Stjerneskema
Stjerneskemaet er en meget brugt datamodelleringsteknik i Power BI. I denne tilgang er der en central faktatabel, der indeholder nøglemetrikker og målinger, omgivet af dimensionstabeller, der giver kontekst til dataene. Det kaldes en “stjerne”, fordi faktatabellen er i midten, forbundet med dimensionstabeller ligesom punkterne på en stjerne.
#2. Kardinalitet
Kardinalitet definerer forholdet mellem tabeller i Power BI. Det specificerer, hvor mange unikke værdier i en tabel, der matcher værdierne i en anden. Kardinalitetsmuligheder omfatter En til En, En til Mange og Mange til En. At vælge den rigtige kardinalitet er afgørende for nøjagtig datamodellering.
#3. Krydsfilterretning
Hvordan et filter anvendt på data i en sammenkædet tabel vil påvirke dataene i den anden tabel, er kendt som tværfilterretningen. Der er to typer krydsfilterretninger, og disse er som nedenfor:
Enkelt
Enkelt krydsfilterretning er en relationsmulighed, hvor filtre kun kan flyde i én retning, typisk fra dimensionstabellen til faktatabellen. Det sikrer, at filtrering af dimensionstabellen påvirker faktatabellen, men ikke omvendt.
Tovejs
Det tovejs krydsfilter tillader filtre at flyde i begge retninger mellem fakta- og dimensionstabellerne. Det kan være nyttigt i nogle scenarier, men bør bruges med forsigtighed, da det kan føre til uventede resultater, hvis det ikke administreres korrekt.
#4. Snefnug-skema
Billedkredit: Lær.Microsoft.Com
Snefnugskemaet er en forlængelse af Stjerneskemaet, hvor dimensionstabeller er yderligere normaliseret til underdimensioner. Dette skaber et mere struktureret, men komplekst skema. Selvom det kan reducere dataredundans, kan det kræve mere indsats at navigere i Power BI.
#5. Opslagstabeller
Opslagstabeller er dimensionstabeller, der indeholder referenceoplysninger, såsom produktdetaljer eller geografiske data. De bruges til at berige dataene i faktatabeller, hvilket giver yderligere kontekst til analyse.
#6. Datatabeller
Datatabeller er et udtryk, der nogle gange bruges i flæng med faktatabeller. De indeholder de primære data, herunder mål og fremmednøgler, og fungerer som grundlaget for opbygning af Power BI-rapporter og visualiseringer.
Fordele ved datamodellering i Power BI
Sådan laver du datamodellering i Power BI
Oprettelse af en datamodel i Power BI er virkelig enkel. Her er de trin, du skal følge:
Importer dit datasæt til Power BI
Først skal du importere dine datasæt til Power BI. Du kan importere så mange datasæt, som du vil, eller importere et datasæt, der har mange dataobjekter som tabeller, kolonner, rækker osv.
Power BI vil automatisk analysere det importerede datasæt eller dataobjekter og oprette en primær datamodel baseret på navnene på kolonneoverskrifter eller tabeloverskrifter.
Følg disse trin for at importere datasæt:
- Åbn Power BI desktop-appen.
- Det skal vise Power BI-arbejdsområdet sammen med en splash-skærm.
- Klik på Hent data.
- I dialogboksen Hent data kan du vælge, hvilken datakategori du vil importere i navigationsruden i venstre side og kilder eller typer af data i navigationsruden til højre.
- Standardvalget af datakildetype er Alle.
- Da mit datasæt er i en Excel-projektmappe, vælger jeg indstillingen Excel-projektmappe til højre og klikker på Opret forbindelse.
- I dialogboksen Åbn skal du navigere til den Excel-fil, du vil importere på pc’en, og dobbeltklikke på filen for at importere den til Power BI.
- Nu skulle du være i dialogboksen Navigator.
- Der skal du markere de dataobjekter, du vil importere til Power BI-rapporten.
- Klik på Indlæs for at fuldføre dataimportprocessen i Power BI.
Opret en Power BI-datamodel
Når du klikker på knappen Indlæs på Navigator, begynder Power BI at analysere datasættet, oprette dataobjektmodeller, oprette datamodeller og til sidst fører du dig til fanen Rapportvisning.
Hvis du klikker på menuen Tabelvisning i venstre sidepanel, bør du få tabelvisninger af alle de dataobjekter, du lige har importeret til Power BI.
Power BI gemmer ikke dit arbejde automatisk indtil videre. Så du skal klikke på Filer på båndmenuen og derefter klikke på Gem i venstre sidepanel for at gemme filen et sted på din pc.
Nu graver vi dybere ned i datamodelleringsprocessen i Power BI. Følg disse trin:
- Klik på fanen Modelvisning i panelet til venstre i Power BI-arbejdsområdet.
- Du bør nu se standarddatamodellen oprettet af Power BI.
- I det aktuelle eksempel er det et stjerneskema, da der er en faktatabel i midten, og faktatabellen er omgivet af dimensionstabellerne.
- Nu skaber Power BI måske ikke altid nøjagtigt de datamodelforbindelser, du har brug for.
- I det aktuelle eksempel kunne den ikke forbinde faktatabellen med dimensionen Tabel24, selvom der er lignende kolonneoverskrifter Geografi og Geo.
- Det kunne ikke gøre det, fordi kolonneoverskrifterne ikke stemmer overens, som de er.
- To forbinder Table24 med faktatabellens hoveddata, træk blot Geo-objektet i Table24 på faktatabellens Geografi-element i midten.
Det er det! Du har oprettet en datamodel på Power BI. Find nedenfor betydningen af forskellige objekter på relationslinjerne:
- En stjerne i kanten af faktatabellen og det numeriske 1 ved kanten af dimensionstabellen repræsenterer en en-til-mange-forbindelse.
- En pil på forbindelseslinjen mellem to tabeller på Power BI angiver retningen af filteret. Når den skarpe kant af pilen vender mod faktatabellen, vil ethvert filter, der anvendes på dimensionstabellen, påvirke faktatabellen.
- Når der er to pile, påvirker filteret tabellen på begge sider, at fakta- og dimensionstabellerne.
Visualiser dine data
Sådan kan du nu visualisere dit datasæt for at udtrække handlingsorienteret indsigt:
- Klik på fanen Rapportvisning.
- Vælg et hvilket som helst diagram fra afsnittet Visualiseringer til højre.
- Jeg valgte et stakket kolonnediagram.
- Udvid datasættene yderst til højre i Power BI-arbejdsområdet.
- Træk og slip elementer på felterne X-akse og Y-akse i diagrameditoren.
- Power BI opretter automatisk diagrammet for dig.
Brug eksempler på datamodellering i Power BI
Opret holistiske rapporter
For at oprette en multidimensionel rapport eller dashboard på Power BI, skal du bruge Power BI-datamodelfunktionalitet. Data i én tabel giver måske ikke nok mening. Men når du bringer data fra forskellige datasæt og objekter, kan du visualisere data på en bedre måde.
Integrer data
Antag, at der er mange datasæt eller datatabeller i Excel-kildeprojektmappen eller SQL-databasen. I stedet for at lave forskellige Power BI-rapporter kan du forbinde dem alle i et stjerne- eller snefnugskema og visualisere dem som en helhed. Du kan lave bedre datahistoriefortælling ved at forene alle dataobjekter.
Datarensning og transformation
Det bliver først tydeligt, om du skal rense og transformere et rådatasæt, når du forsøger at oprette Power BI-datamodeller.
For eksempel, hvis værktøjet ikke er i stand til at linke relaterede datakolonner eller tabeller i datamodellen, kan der være en uoverensstemmelse i kolonneoverskrifter. Så ved du, hvad du skal rette.
Et andet eksempel kunne være mere end ét element i tabellerne. Antag, at der kun er 4 geografier i datasættet, nemlig USA, CA, UK og DE. Men datamodellen viser en ekstra, som er Blank. Det skyldes, at nogle af geografinavnene indeholder unødvendige mellemrum, og derfor klassificerer Power BI dem i et nyt geografielement.
Styr datasynlighed
Du kan begrænse, hvem der kan se hvad i din Power BI-rapport eller dit dashboard ved at bruge fanen Modelvisning. Ved at klikke på øjenikonet på hvert datakort på Power BI-datamodelarbejdsområdet kan du skjule eller vise tabellen.
Hvis der er mere end én kolonne på datakortet, kan du også tilpasse synligheden af disse kolonner.
Manipuler udvalgte datatabeller
Hver datatabel på Power BI-datamodelgrænsefladen leveres med flere muligheder eller et ikon med tre prikker. Der kan du opdage følgende aktiviteter, som du kan udføre på den valgte datatabel:
- Nyt mål eller kolonne
- Opdater data
- Administrer relationer
- Inkrementel opdatering
- Administrer sammenlægninger
- Og mange flere
Konklusion
Så det handler om at skabe en Power BI datamodel til at visualisere store og distribuerede datasæt i én logisk rapport eller dashboard.
Indtil videre har du lært om de forskellige datamodelleringsteknikker i Power BI. Du fandt også trinene til at oprette en Power BI-datamodel fra bunden. Følg trinene og lav din egen datamodel på ingen tid.
Næste op, de bedste dataanalytikerkurser til at kickstarte din datavidenskabs- eller dataanalytikerkarriere.