Top 11 ressourcer til datavidenskab og maskinlæring

Data er den nye olie. Og Machine Learning er ilden. Den, der kontrollerer disse to, vil kontrollere verden.

Nej, ovenstående er ikke en eller anden pompøs sætning hentet fra en dystopisk roman.

Det er en realitet.

Den nye verdensorden handler om at indsamle enorme mængder af relevante data og bearbejde dem til brugbar indsigt – noget menneskeheden ikke har været i stand til i historien. Det er den slags teknologi, der tillader et land at komme foran de andre og i sidste ende styre verden.

Som et resultat bliver det taget meget, meget alvorligt af de progressive nationer i verden.

Et lukrativt karrierevalg

Bortset fra internationale intriger er datavidenskab og maskinlæring et varmt nyt felt med en utrolig mulighed. Efterspørgslen er ude af hitlisterne (mildt sagt), og der er ikke nok dataforskere i nærheden. Ikke engang middelmådige.

Det er som om, vi pludselig har opdaget mange nye beboelige planeter, og der er ikke nok mennesker til at flytte dem til. Jeg kunne blive ved og ved og lyde som en ødelagt plade, men jeg synes, at denne infografik gør arbejdet meget bedre:

Kilde: insidebigdata.com

Så vi ser, at lønningerne starter ved $50.000+ og for ledere kan skyde langt forbi $250.000.

Og ikke bare det, den gennemsnitlige person på denne planet vil generere 1,7 MB data i sekundet. Det er 3.500+ TB data over hele levetiden – flere data, end vi ved, hvordan vi skal håndtere lige nu, endsige bruge til analyse. At sige, at fremtiden er lys, ville være at gøre denne storslåede nye græsgang en bjørnetjeneste.

Er datavidenskab og maskinlæring svært?

Godt spørgsmål!

Fra min erfaring er svaret både “ja” og “nej”.

Kunstig intelligens (og i forlængelse heraf maskinlæring) er den sværeste ting at gøre, hvis du er tilbøjelig til at gå ind i forskning og skubbe rammen. Til et sådant arbejde kan selv en ph.d. i datalogi og matematik er ikke nok. Men så har den gennemsnitlige person hverken ambitionen eller tiden til sådan en forfølgelse.

I den anden ende er det, jeg vil kalde Applied Data Science og Machine Learning.

Det vil sige, at du tager eksisterende værktøjer, teknikker og algoritmer og anvender dem til at løse nogle problemer i den virkelige verden. Denne del kræver dedikation, perception og kreativ tænkning (og kendskab til nogle simple matematiske begreber, som hurtigt læres), men hvad angår ægte “teknisk” viden, er den meget mere skånsom, end hvad jobbet som softwareingeniør kalder.

Med andre ord er det ikke en cakewalk, men at gå efter forholdet mellem belønning og indsats er en af ​​de bedste investeringer derude.

Nu hvor du har skærpet din vilje til at blive dataforsker og maskinlæringsingeniør, lad os begynde at udforske de bedste muligheder derude.

  Sådan tilpasses KDE-skrivebordet

Machine Learning (Google)

Ikke mange mennesker er klar over, men Google har en omfattende, yderst praktisk og gratis kursus i Machine Learning. Ifølge virksomheden er det en del af deres forpligtelse til at fremme AI/ML-teknologier og holde viden åben.

Det bedste ved dette kursus er, at der ikke er nogen forudsætninger, men vær forberedt på at bruge ekstra tid på at udforske statistikkoncepterne på egen hånd.

Jeg mener, det er ikke nødvendigt, men hvis du har nul baggrunde i avanceret statistik, er forklaringerne i dette kursus måske ikke nok. En anden fangst er, at dette kursus introducerer Machine Learning via TensorFlow, som er en ML-implementering udviklet af Google. Så på en måde sigter Google efter at promovere sine API’er til Machine Learning, men i betragtning af den værdi, som dette kursus tilbyder, kan jeg ikke se, hvordan det skulle være en stopklods.

Hvis noget, er TensorFlow en af ​​de nemme måder at komme ind i ML på og nyder rabiat popularitet (for en sammenligning af AI-rammer, se dette).

Datavidenskab

Navnet Harvard vækker ærefrygt, og det samme gør dette kursus.

Først og fremmest: det er ikke et lad os-blive-hurtigt-beskidt-kursus, hvor du tipper på tæerne omkring Machine Learning ved at skrive et uddrag her eller et script her. Dette kursus er en streng ilddåb, der kræver hårdt arbejde og en betydelig investering af tid.

Kurset leveres med gratis videoer, kode (hostet på GitHub) og løsninger til laboratorieøvelser, så praktisk talt er du ikke tilbageholdt af noget, hvis du vil tage det.

Ideelt publikum?

Du … jeg laver ikke sjov.

Jeg vil sige, at arbejdende fagfolk med anstændig matematikuddannelse, selvom de måske ikke er til matematik længere (vanerne med slutninger og beviser er det mest nødvendige). Men endnu en gang, vær advaret: du tror måske, du er god, men dette kursus vil føles som at have hærdede negle til morgenmad – øvelsesproblemerne er udfordrende nok til at få dig til at græde, men så er det måske lige præcis det, du’ leder efter!

Maskinelæring

Gå ind i en bar fyldt med dataforskere og spørg, hvem Andrew Ng er, og du vil få tæsk af dit liv.

I kredsene af datavidenskab og maskinlæring har Andrew Ng opnået en gudelignende status takket være sit enestående kursus om Coursera — Maskinelæring.

Og hvis du tvivler på Andrew Ngs legitimationsoplysninger, lader jeg dette tale for sig selv:

Det er et betalt kursus, idet det er en del af Courseras prisplan, men økonomisk engagement og beslutsomhed er ikke de eneste forudsætninger. Dette er et langt kursus, da Andrew dykker dybt ned i matematikken bag alt ML og dissekerer populære algoritmer. Men heldigvis er det et komplet kursus, og du vil trin for trin blive guidet ind i de mørkeste dybder og bragt tilbage.

  Sådan stopper du din Mac fra overophedning

Jeg kan varmt anbefale det, hovedsageligt fordi det er blevet en ting i dag at fremvise færdiggørelsesbeviset for dette kursus!

Anvendt datavidenskab

Specialiseringer på Coursera består af en række kurser, der har til formål at tage dig fra nul til dygtighed i et bestemt koncept. Hvis du leder efter et komplet, seriøst, men alligevel venligt kursus om datavidenskab og maskinlæring med Python, kan jeg ikke anbefale dette specialisering nok.

I slutningen af ​​kurset optjener du et certifikat.

DataCamp

DataCamp tilbyder masser af datavidenskabelige kurser, som også omfatter flere færdigheder og karrierespor. Fra datamanipulation til maskinlæring vil du få karriereopbyggende dataforskerfærdigheder i Python og R, der vil hjælpe dig med at få succes inden for datavidenskab.

Med det byte-store indhold i DataCamp kan du lære i dit eget tempo. Disse kurser giver dig praktisk erfaring, hvorigennem du vil fremme dine datavidenskabelige færdigheder.

Du kan starte med den gratis version og evaluere kurset ved at se på det første kapitel.

edX

Lær af MITx, Harvardx, IBM, RICEx, UCSanDiegox og GTx på edX platform.

De har alle et omfattende læseplan, der hjælper dig med at besidde dataforskerfærdigheder. Disse programmer er bedst egnede til dem, der har statistik eller datalogi baggrund.

Hvis du ikke leder efter et program, kan du vælge en ala-carte. På edX finder du mere end 200 kurser relateret til datavidenskab, som dækker Python, R, Excel, sandsynlighed, statistik, maskinlæring, datavisualisering og mange flere.

Kodeakademi

Codecademy er en anden platform, som er et af de bedste systemer derude, der hjælper dig med at lære at kode. De tror på “Learn by doing” og har masser af øvelsesprojekter og tests på deres platform.

Det datavidenskabskursus tilbudt af Codecademy inkluderer SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn og mange flere biblioteker.

Hele karrierevejen indeholder 26 kurser, som er mere end nok til at hjælpe dig med at blive en succesfuld dataforsker.

Dette datakursus:

  • Giver dig indgående kendskab til datavidenskab
  • Giver en køreplan, der er nem at følge
  • Gør dig jobparat ved at hjælpe dig med at få nok praktisk erfaring

Udemy

Udemy behøver ingen introduktion.

Python til Data Science og Machine Learning Bootcamp på Udemy er et af de mest populære kurser med over 85K+ rating på 4,6 og er blevet taget af 370K+ studerende over hele kloden.

Nedenfor er emnerne dækket i dette kursus:

Nedenfor er funktionerne/leverancen af ​​dette kursus:

  • 25 timers on-demand videoer
  • Fuld livstidsadgang
  • 13 artikler og fem ressourcer, der kan downloades
  • Adgang på mobil og tv
  • Certifikat for gennemførelse
  • 30-dages pengene-tilbage-garanti

Så hvis du foretrækker et budgetkursus, vil dette være bedst egnet for dig at komme i gang.

Google AI

Ville du være interesseret i at lære maskinlæring fra ML-eksperter hos Google?

Nå, så skal du tjekke kurser vedr Google AI.

Denne platform har Machine Learning og Data Science-kurser og indhold for studerende, softwareingeniører, dataforskere og endda forskere. Disse kurser er gratis.

  Bliv en ISTQB-ekspert med disse 9 certificeringer

Til at begynde med, Machine Learning Crash Course hos Google AI bør være dit foretrukne kursus. Dette er et tempofyldt kursus med en praktisk introduktion ved hjælp af TensorFlow API’er. Nedenfor er detaljerne i dette kursus:

Denne platform har også specifikke kurser om vigtige maskinlæring-emner som klyngedannelse, anbefalingssystemer, test og fejlretning i maskinlæring, dataadskillelse og feature engineering i maskinlæring. Hvis du allerede kender det grundlæggende i maskinlæring, vil disse kurser være af merværdi.

Udacity

Udacity er også en meget populær e-læringsplatform, der har et væld af kurser om trending-teknologier. Det har adskillige brancheførende programmer bygget og anerkendt af topvirksomheder verden over, såsom AT&T, AWS, Google, IBM.

Et af uddannelserne på Udacity er for Data Science – School of Data Science. Dette program hjælper dig med jobs som dataanalytiker, dataforsker, dataingeniør og forretningsanalytiker. Et kursus om Data Scientist i dette program er det afgørende, der dækker begreber om maskinlæring, deep learning og software engineering. Du skal have grundlæggende viden om maskinlæring for at vælge dette kursus.

Hvis du kender python-programmering, men er ny inden for maskinlæring, er der et andet program på Udacity – Skole for AI. Dette program har kurser, der starter fra grundlæggende maskinlæring.

Dyb læring

Dette kursus er en velsignelse og er min mest foretrukne anbefaling på denne liste, hvis du er en koder.

Jeg vil sige det igen: hvis du er en koder.

Det er fordi dette kursus ikke bruger tid på at lære dig det grundlæggende i programmering. Kursusbeskrivelsen siger det i meget klare vendinger (understregningerne er originale):

Vi antager, at alle, der tager dette kursus, har mindst et års erfaring med kodning. Kurset bruger python som undervisningssprog, så hvis du ikke allerede kender python, så antager vi, at du vil bruge tiden på at lære – for en erfaren koder bør du opdage, at python er et ganske nemt sprog at lære.

Så hvis du allerede kender Python (hvis ikke lære her), eller hurtigt kan blive komfortabel, er dette det perfekte kursus for pragmatikere, der ønsker at bygge rigtige, brugbare systemer uden at bekymre sig for meget om algoritmernes teoretiske fundament.

Jeg vil måske endda sige, at det er for de utålmodige tinkere (som mig!), der hader ceremoni og monotoni.

Og åh, har jeg nævnt, at det er 100 % gratis og har et fantastisk fællesskab?!

Konklusion

Pyha!

Dette var en svær liste at kompilere. Ikke fordi der ikke var nok gode kilder, men fordi der var alt for mange!

Machine Learning er et domæne, der bogstaveligt talt er eksploderet og løser svære problemer virkelig elegant, og så er der hundredvis af kurser online, gratis og betalt, de fleste af dem er virkelig, rigtig gode. Men dette kan også være en kilde til forvirring, og derfor har jeg forsøgt at koge det ned til elleve for forskellige typer elever alt efter deres erfaringsniveau.

Jeg håber det hjalp!