Lær R og bliv dataforsker

Populariteten af ​​programmeringssproget R er stigende, især inden for datavidenskab og analyse.

Da det giver bedre datavisualiseringsteknikker, R programmering spiller en afgørende rolle i statistik.

Men at lære dette sprog kan være frustrerende, hvis du ikke har en klar vej til at nærme dig det. Tidligere havde du måske kæmpet meget, mens du lærte R eller et hvilket som helst andet sprog.

Stol på mig; du er ikke alene!

Skyld ikke helt dig selv eller sproget skylden; problemet kan have været i din tilgang. Den måde, du lærer noget på, har en massiv medvirken til at levere det endelige resultat.

Hvis du har en klar strategi for, hvordan og hvorfor du skal lære et bestemt sprog, forstærkes chancen for, at du er dygtig til det. På samme måde, hvis dit mål og din strategi ikke stemmer overens, kan du kede dig med sproget og ende med at stoppe det midtvejs.

Det er analogt med at lære et talt sprog.

Så når du er klar til at lære R, så få dit motiv klart i første omgang, hvad enten det er at udvide din viden eller finde en karriere inden for datavidenskab. Forbered derefter en strategi og afstem den med dit mål.

…Og begynde at lære.

I denne artikel vil jeg fortælle om nogle gode ressourcer til at lære programmeringssproget R, der vil give dig den rigtige tilgang til at gøre tingene lettere.

Men først og fremmest,

Hvad er R-programmeringssproget?

R er et open source programmeringssprog til grafik og statistisk databehandling.

Den blev udviklet i 1993 af Ross Ihaka & Robert Gentleman. Det ligner programmeringssproget – S. Man kan sige, at programmeringssproget R er en implementering af S, der kombinerer leksikalsk scoping-semantik. Softwaren er hovedsagelig skrevet i C, R og Fortran.

R tilbyder en bred vifte af både statistiske og grafiske teknikker ud over at være meget udvidelsesdygtige. Det omfatter klassisk statistisk test, lineær og ikke-lineær modellering, tidsserieanalyse, klyngedannelse og klassificering.

En af R-sprogets største styrker er at være ubesværet med at producere et veldesignet plot af publikationskvalitet, inklusive matematiske formler og symboler.

R.s evner

R er en slags integreret suite bestående af softwarefaciliteter, du kan bruge til beregning, grafisk repræsentation og datamanipulation.

Det omfatter:

  • Effektiv opbevarings- og datahåndteringsfacilitet
  • En integreret, sammenhængende og stor samling af dataanalyseværktøjer
  • En pakke af forskellige operatorer, der er nyttige til at beregne arrays i specifikke matricer
  • Enkelt, effektivt og veludviklet programmeringssprog med loops, conditionals og brugerdefinerede variabler
  • Grafiske faciliteter til at analysere data og vise dem på papir eller på skærmen
  • R er i stand til at forlænge gennem pakker. Faktisk leveres omkring 8 pakker ved hjælp af R-distribution, mens flere kan tilføjes med CRAN-stedfamilien.
  • Interoperabilitet på tværs af platforme
  • I stedet for at bruge en compiler, bruger R en fortolker, som hjælper med at gøre kodeudvikling lettere.
  • Det forbinder godt med forskellige databaser og bringer information fra MS Access, Excel, MySQL, Oracle, SQLite osv.
  • Den integrerer kraftfulde værktøjer til at kommunikere rapporter i forskellige former såsom HTML, XML, CSV, PDF og interaktive websteder med R-pakker.
  • R-pakker kommer med forskellige koder, funktioner og funktioner, der er skræddersyet til statistisk modellering, dataanalyse, maskinlæring, visualisering, dataimport og manipulation.

Hvordan hjælper R med dataanalyse?

Dataanalyse ved hjælp af R foregår i en række forskellige trin:

  • Programmer eller import: Programmering med R, eller du kan importere data fra databaser og filer til R-softwaremiljøet
  • Transform: Dataorganisering sker ved at transformere en kolonne til en variabel i løbet af en række til en observation. Observer dine interesser, opret en ny variabel som funktion af aktuelle variabler, og opdag observationsstatistikker.
  • Visualisering: Datarepræsentationer i en grafisk form for nemt at genkende tendenser, mønstre og dataundtagelser.
  • Modeller: Disse er komplementære visualiseringsværktøjer såsom beregningsmæssige eller matematiske værktøjer til at besvare observationsspørgsmål.
  • Kommunikation: Kommunikation af resultater med andre, lige fra visualisering til modellering, ved hjælp af plots i printkvalitet, der er nemme at producere, til at dele med alle i verden.
  11 bedste apps til at overvåge og stoppe snorken

Hvem bruger R og hvorfor?

R er ikke kun tillid til akademikere, men også af store virksomheder, herunder Google, Facebook, Airbnb, Uber og mere. Det bruges i sundhedspleje, rådgivning, regering, forsikring, energi, finans, medier, næsten overalt. De bruger det til statistisk inferens, maskinlæringsalgoritmer og dataanalyse.

Du kan se, efterspørgslen efter R er i forskellige sektorer. Ud over dette er dataanalyse utvivlsomt med til at forme nutidens virksomheder. Selvom der er masser af værktøjer til rådighed, skiller R sig ud. Det er fordi du måske har:

  • Excel og PowerBI, men de mangler modelleringsevne;
  • Python er fantastisk til AI og ML, men har ikke kommunikationsfunktioner;
  • SAS er god til statistisk analyse, men ikke gratis
  • Tableau er fremragende til grafiske repræsentationer, men det skal gøre det bedre i beslutningstagning og statistik.

R udfylder dog hullet ved at tilbyde en fremragende læringskurve med en god balance mellem dataimplementering og analyse.

Derfor giver det mening at lære R til datamanipulation og -analyse og endda blive dataforsker.

Og det er grunden til, at dataforskere bruger R til at forstå data, udføre manipulation, lave den bedste tilgang og kommunikere med andre gennem rapporter, dashboards eller webapps. På denne måde udfører en enkelt platform alt arbejdet.

Nu ved du, hvordan R fungerer, og hvorfor du skal gå efter det, men hvor skal du lære R?

Er det så svært at lære?

Hvis du stillede mig disse spørgsmål for et par år siden, ville jeg have sagt ja, det er lidt svært på grund af dets komplekse struktur. Men nu introduceres pakker for at overvinde dette problem, hvilket har gjort datamanipulation nemmere og intuitivt, og det er ret nemt at oprette grafer.

Pakker som TensorFlow og Keras lader dig skabe avancerede ML-teknikker; du kan kalde Python, C++ og Java i R og forbinde med Hadoop eller Spark. Og R har også udviklet sig med hensyn til beregningshastighed.

Så vil du lære R?

Jeg går ud fra et JA!

Lad os finde nogle gode ressourcer til at lære R.

Data Scientist hos R

Få de R-færdigheder, der kan hjælpe dig med at opbygge din karriere som Data Scientist med Datacamp. For at starte kurset behøver du ingen forudgående viden eller erfaring på dette område.

De vil lære dig det alsidige R-sprog, og hvordan du kan bruge det til at importere, manipulere, visualisere og rense data, som er de grundlæggende integrerede færdigheder, du har brug for. Med interaktive øvelser kan du få praktisk erfaring med berømte R-pakker såsom ggplot2 sammen med Tidyverse-pakker såsom readr og dplyr.

Kurset vil også introducere dig til nogle datasæt fra den virkelige verden, der hjælper dig med at lære maskinlæring og statistiske teknikker, der er nødvendige for at skrive funktioner og udføre klyngeanalyse helt alene.

Alt du skal gøre er at starte dette kursus, udvikle R-færdigheder og fortsætte din vej til at blive en succesfuld dataforsker. De tilbyder 75+ timers læringsressourcer. Det inkluderer introduktion af sproget til at mestre dataanalyse grundlæggende med typiske datastrukturer som matricer, vektorer, datarammer osv.

R Programmering AZ

Udemy bringer R Programming AZ med praktiske øvelser for at hjælpe dig med at blive dataforsker. Kurset er opdelt i 8 afsnit, 82 forelæsninger, og tager cirka 11 timer at gennemføre.

  Sådan husker du vigtige beskeder i Slack

De lærer dig R trin for trin, og du vil lære værdifulde begreber, der er anvendelige med det samme efter hver forelæsning. Og en anden stor ting er, at de lærer dig begreber ved hjælp af levende eksempler. Hele uddannelsen er fuld af analytiske udfordringer fra den virkelige verden, som du vil løse i løbet af dit foredrag og din lektieøvelse.

Alle med ethvert færdighedssæt kan lære dette kursus, men du skal lære R-sproget og tage spændende udfordringer op. Kursusmaterialet lærer dig dets kerneprincipper og hvordan du opretter variabler, vektorer, sløjfer og funktioner.

Du vil også lære om normalfordelingen og praksis med økonomiske data, statistiske data og sportsdata. Desuden vil du lære at bruge R Studio og tilpasse det baseret på dine præferencer.

I slutningen af ​​dette kursus vil du installere R-pakker og forstå store tal, heltal, dobbelt, tegn og mere. Kurset inkluderer også avanceret visualisering ved hjælp af GGPlot2 sammen med lektieløsninger og bonustutorials.

Statistik med R

Coursera tilbyder dette kursus – Statistik med R-specialisering for at hjælpe dig med at mestre R til dataanalyse, herunder modellering, inferens og Bayesianske teknikker. Dette kursus er helt GRATIS og tilbydes af Duke University.

Dette kursus vil få færdigheder som statistisk inferens, lineær regression og statistik, RStudio, R-programmering, eksplorativ dataanalyse, statistisk hypotesetestning, Bayesiansk statistik, Bayesiansk lineær regression, Bayesiansk inferens, regressionsanalyse og modelvalg.

Specialiseringen vil lære dig at visualisere og analysere data i programmeringssproget R og derefter oprette reproducerbare rapporter. Du vil lære at vise statistisk inferens i dens forenede natur og udføre modellering og andre teknikker til at træffe datadrevne beslutninger.

Kurset vil også hjælpe dig med at kommunikere resultater korrekt, organisere og visualisere data ved hjælp af R-pakker og kritisere beslutninger og påstande. Det vil hjælpe dig med at opbygge din portefølje med forskellige projekter inden for dataanalyse for at demonstrere din viden og færdigheder udover at lande et højtbetalt job.

Dette kursus på begynderniveau tager cirka 7 måneder at gennemføre, har en fleksibel tidsplan, komplette online forelæsninger og et delbart certifikat ved afslutningen.

Kom godt i gang med R

Et andet kursus af Coursera på denne liste er – Kom godt i gang med R.

Dette er et kursus på begynderniveau, der tager omkring 2 timer at gennemføre, og du kan kun få adgang til det på dit skrivebord uden behov for download. Dette guidede projekt lærer dig de grundlæggende R-programmering for at tage dit første skridt mod dataanalyse.

Her vil du lære, hvordan du bruger R Studio eller R GUI og de forskellige datastrukturer og typer, der bruges på dette sprog. Til sidst vil de lære dig, hvordan du installerer R-pakkerne og importerer dine datasæt til R Studios arbejdsområde.

Der er ingen nødvendige forudsætninger for at gennemføre dette projekt; bare grundlæggende computerviden er tilstrækkelig. I det guidede projekt ville dit arbejdsområde være et cloud-skrivebord, du kan få adgang til fra din browser. Din instruktør vil guide dig i en delt skærm via en video for at få dig til at forstå tingene trin for trin.

Udacity

Lær R-programmering for at blive dataforsker med Udacity. Den omtrentlige tid, dette kursus tager, er 3 måneder med 10 timers indsats hver uge, og det kræver ingen hårde forudsætninger.

Pensum inkluderer at lære dig at kode i R, kommandolinje, SQL og Git, så du kan løse data-relaterede problemer. Du vil lære grundlæggende SQL som JOINs, underforespørgsler og aggregeringer og bruge dem til at besvare forretningsproblemer.

Lær grundlæggende, herunder datastrukturer, sløjfer, funktioner og variabler. Ud over det vil du lære, hvordan du visualiserer data gennem GGPlot2.

  Mestrer hurtigt hastighedslæsning med Readsy Web App

Programmet omfatter projekter fra det virkelige liv med fordybende indhold udviklet af eksperter, mentorstøtte og karrieretjenester som CV og porteføljegennemgange. Studér efter din egen tidsplan, og få personlig feedback, praktiske tips og yderligere forslag til flere ressourcer.

ML Scientist hos R

Mestre R-sproget for at blive en selvsikker maskinlæringsforsker med Datacamp. De tilbyder 15 kurser i alt med 60+ timers indsats i at lære R. Her; du vil forbedre dine R-færdighedssæt med en værktøjskasse og udføre uovervåget og overvåget læring.

De vil lære dig at behandle data til modeloprettelse, træne og visualisere modellerne og teste deres ydeevne. Ud over dette vil du hjælpe med at justere deres parametre for at udføre bedre ydeevne.

I mellemtiden vil du også lære Bayesiansk statistik, Spark og naturlig sprogbehandling (NLP). De vil lære dig maskinlæring grundlæggende for klassificering, hvordan du kan forudse fremtidige begivenheder gennem lineær regression, tilfældig, skove, xgboost og additive modeller.

Du vil også lære dimensionalitet, klyngedannelse, ML i Tidyverse, logistisk regression, klyngeanalyse, ML med en indikator, træbaserede modeller, støttevektormaskiner, emnemodellering, hyperparameterjustering og mere.

Dataanalyse med R

Edureka tilbyder træningsprogrammet– Dataanalyse med R for at hjælpe dig med at erhverve ekspertise inden for datamanipulation, visualisering, undersøgende dataanalyse, minedrift, sentimentanalyse og regression.

Uddannelsen kan også hjælpe dig med at lære R Studio til casestudier over sociale medier og detailhandel. De har designet dette kursus for at tilbyde de færdigheder og viden, der er nødvendige for at blive en dataanalytiker. Det dækker grundlæggende R-koncepter til avancerede emner såsom beslutningstræ-ensemble, kollaborativ filtrering og mere.

Modulerne leder dig gennem vigtige terminologier såsom business intelligence, data og information, business analytics og mere. Du vil lære dataimportmetoder, undersøgende dataanalyse, clustering, lineær og logistisk regression, overvågede ML-teknikker, ANOVA, R-pakker, oprettelse af plots og mere sammen med projektarbejde.

For at tage dette kursus skal du have et grundlæggende kendskab til statistik. Det inkluderer 30 timers online klasser, hvor du vil få praktiske opgaver at udføre efter hver klasse, sammen med livslang adgang til kurset med præsentationer, klasseoptagelser, installationsvejledninger og quizzer. Få et certifikat ved kursusgennemførelse.

Youtube

Lær R på Youtube med Barton Poulson, som underviser i det grundlæggende i R-sprog og statistisk beregning.

Selvstudiet dækker emner som hvordan man installerer R, ting om R Studio, plotfunktion, pakker, histogrammer, søjlediagrammer, punktplot, opsummeringsfunktion, overliggende plots og beskrivelsesfunktion.

Han underviser også i, hvordan man vælger cases, faktorer, dataformat, hvordan man indtaster data, importerer data, begreberne hierarkisk clustering, regression, hovedkomponenter og mere.

Kodeakademi

Kodeakademi introducerer dig til de grundlæggende begreber i programmeringssproget R. Der er ingen specifikke forudsætninger for at lære dette kursus eller nogen kodningsviden nødvendig.

Her lærer du, hvordan du organiserer data, ændrer dem og renser datarammerne. De vil også lære dig at bygge datavisualiseringer og vise indsigt. Ud over dette vil du lære hypotesetestning og statistik for at udmærke dig inden for dataanalyse.

Kursets pensum omfatter også det grundlæggende i aggregater og sammenføjning af tabeller med dplyr; beregne tilstand, middelværdi og median; og statistik som kvartiler, interkvartilområde og kvantiler.

Du kan også teste din viden gennem quizzer for at skærpe syntaks og hukommelse. Det tager omkring 20 timer at gennemføre kurset, og med Pro-planen kan du tjene et certifikat.

Datamentor

Datamentor Kurset inkluderer ubegrænset adgang til 45+ videoer, interaktive opgaver, R Essentials e-bog og et projekt.

Den gør dig bekendt med det grundlæggende i datavidenskab, dets processer og de forskellige trin, du skal tage for at fuldføre en datavidenskabsopgave som at hente data, udforske, modellere og formidle rapporten.

Konklusion

Med masser af tilgængelige ressourcer er det ikke længere en vanskelig opgave at lære programmeringssproget R. Alt du behøver er at have en passion for læring og et stærkt ønske om at begive dig ud i datavidenskab.

Så er du en håbefuld datavidenskabsprofessionel? 💡

Lær R ved hjælp af de ovennævnte fantastiske kurser.