Her er en liste over NLP-kurser og -specialiseringer, der hjælper dig med at komme i gang med din naturlige sprogbehandlingsrejse!
Natural Language Processing (NLP) ligger i skæringspunktet mellem datalogi og computerlingvistik. Fra sentimentanalyse af kundeanmeldelser til at drive marketingbeslutninger til maskinoversættelse og chatbots, NLP driver alle sektorer.
Hvis du har erfaring med at bygge maskinlæringsmodeller, kan du tilføje NLP til din værktøjskasse for at løse forskellige problemer: tekstresumé, besvarelse af spørgsmål, generering af naturligt sprog og mere.
Vi vil se på de brede færdighedskrav til NLP-roller og derefter fortsætte til den kuraterede liste over ressourcer for at komme i gang med naturlig sprogbehandling.
Indholdsfortegnelse
NLP-karriereveje: NLP-ingeniør, NLP-udvikler og mere
Fremskridt inden for forskning har givet næring til udviklingen af moderne NLP-teknikker. Med en gennemsnitsløn på over 117.000 USD har NLP-ingeniør- og udviklerroller for nylig vundet popularitet.
Kompetencesættet er forskelligartet, fra dataindsamling til downstream NLP-opgaver og et praktisk kendskab til lingvistiske begreber, såsom afhængighedsparsing og Part-of-Speech (POS) tagging, til et praktisk kendskab til transformatormodeller.
For at komme ind i NLP kræves færdigheder i programmering og maskinlæring. Du bør også have erfaring med deep learning frameworks såsom PyTorch og TensorFlow og NLP biblioteker som spaCy og HuggingFace.
Natural Language Processing (NLP) kurser
Lad os derefter gennemgå nogle af de bedste kurser, der er tilgængelige på tværs af populære læringsplatforme. Vi angiver også de forudsætninger, du skal bruge for at få mest muligt ud af disse kurser. 👩🏫
CS224n: NLP med Deep Learning
Undervist af prof. Chris Manning, CS224n: NLP med Deep Learning, der tilbydes på Stanford, er et af de bedste kurser til at lære naturlig sprogbehandling. Forelæsningerne er tilgængelige på YouTube, og forelæsningsnoterne og øvelseshæfterne – fra det nuværende og tidligere tilbud – er frit tilgængelige på kursets hjemmeside.
📋 Forudsætninger
- Python programmering
- Matematik: Statistik, Sandsynlighed, Calculus, Lineær Algebra
- Maskinlæringsgrundlag
Dette er et semesterlangt kursus, der dækker en bred bredde af NLP-emner:
- Ord vektorer
- Tilbagevendende neurale netværk
- Opmærksomheds- og underordsmodeller
- Transformere og applikationer
💲 Pris: Gratis ✅
NLP Specialisering: Coursera
Natural Language Processing Specialization af DeepLearning.AI på Coursera er en af de populære læringsressourcer. Denne specialisering har til formål at lære traditionelle NLP-teknikker gennem fire kurser til de seneste fremskridt, såsom transformer- og reformermodeller.
📋 Forudsætninger
- Mellem Python
- Maskinlæring og viden om deep learning-rammer
- Calculus, Lineær algebra, Statistik
Følgende er kurserne i specialet:
Hvert kursus i specialiseringen tager over 30 timer at gennemføre og tager et par måneder at gennemføre hele specialiseringen.
👩🏽💻 Her er nogle af de projekter, du vil bygge, mens du arbejder gennem denne specialisering:
- Tekst autofuldførelse model
- Spørgsmål Besvarelse ved hjælp af BERT
- Tekstopsummering
- Chatbot ved hjælp af reformer-model
NLP i TensorFlow: Coursera
Hvis du allerede er bekendt med TensorFlow, kan du tage NLP i TensorFlow af DeepLearning.AI på Coursera for at bygge NLP-modeller med TensorFlow.
📋 Forudsætninger
- Python og matematik
- Arbejdskendskab til TensorFlow
Kurset dækker følgende:
- Brug af TensorFlow API’er til teksttokenisering og forbehandling
- Ordindlejringer
- Naturlig sproggenerering
Sekvensmodeller: Coursera
Sequence Models-kurset af DeepLearning.AI på Coursera i Deep Learning Specialization er designet til at udstyre eleverne med en praktisk viden om NLP over en 4-ugers periode.
📋 Forudsætninger
- Python
- Machine Learning og lineær algebra
Kurset dækker sekvensmodeller for NLP med fokus på følgende:
- Recurrent neurale netværk (RNN’er) på karakterniveau til sprogmodellering
- Introduktion til opmærksomhedsmekanisme, selv- og multihoved opmærksomhed
- Brug af Hugging Face-transformere til at besvare spørgsmål
NLP: Knusende ansigt
Hugging Face-teamet udgav et gratis NLP-kursus, der dækker grundlæggende til avancerede koncepter, med fokus på at arbejde med Hugging Face-økosystemet.
📋 Forudsætninger
- Færdighed i Python
- Arbejdskendskab til dyb læring
- Erfaring med PyTorch og TensorFlow (nyttigt, men ikke påkrævet)
Kurset har 12 kapitler og er opdelt i tre sektioner, der dækker følgende:
- Brug af Hugging Face-transformere
- Forståelse af datasæt og tokenizer-biblioteker
- Avancerede anvendelser af transformere, optimering af modeller til produktion
Du har adgang til korte videoforedrag, tekstbaserede sektioner for koncepter og colab-notesbøger.
💲 Pris: Gratis 🤗
NLP på Google Cloud: Pluralsight
NLP på Google Cloud introducerer eleverne til at bygge NLP-løsninger ved hjælp af Vertex AI på Google Cloud-platformen.
Forudsætning: Arbejdskendskab til GCP
Dette kursus introducerer eleverne til følgende:
- Tekstgengivelse
- Arbejde med DialogFlow API
- Opbygning af neurale netværk, tilbagevendende neurale netværk (RNN’er), Long Short Term Memory (LSTM) netværk og Gated Recurrent Units (GRU’er)
- Bruger Vertex AI
- Opmærksomhedsmekanisme og store sprogmodeller
Byg en NLP-løsning med Azure
Opbygning af en NLP-løsning med Microsoft Azure er et projektbaseret kursus om Pluralsight. På dette projektbaserede kursus lærer du at bygge en NLP-løsning ved at behandle tweet-datasæt med kundeanmeldelser.
📋 Forudsætninger
- Python programmering
- Kendskab til Azure-portalen
De vigtigste opgaver, du vil udføre undervejs, omfatter følgende:
- Sproggenkendelse
- Navngivet enhedsgenkendelse
- Nøglesætningsudtrækning
- Følelsesanalyse
NLP med PyTorch: Pluralsight
NLP med PyTorch på Pluralsight hjælper dig med at komme i gang med NLP. Dette kursus dækker ikke den nyere transformatorarkitektur, men dækker meget af naturligt sprogbehandling med PyTorch.
Forudsætning: Kendskab til PyTorch
Dette kursus dækker følgende:
- Tilbagevendende neurale netværk (RNN’er)
- Binær og multi-klasse tekstklassificering
- Word vektor indlejringer
- Følelsesanalyse ved hjælp af ordvektorer
- Sekvens-til-sekvens-modeller til sprogoversættelse
At blive en NLP-ekspert: Udacity
At blive en NLP-ekspert er den officielle nanograd til behandling af naturligt sprog, der tilbydes af Udacity’s School of AI. Dette nano-uddannelsesprogram vil hjælpe dig med at lære både traditionelle og moderne NLP-teknikker, såsom opmærksomhed ved byggeprojekter.
📋 Forudsætninger
- Python programmering
- Statistikker
- Machine learning og deep learning
Udacitys programmer består af videoforelæsninger, kodningsøvelser og slutstensprojekter. I dette kursus i naturlig sprogbehandling bygger du følgende projekter:
- En del af talemærkning (POS-tagging)
- Den ende-til-ende maskinoversættelsesmodel
- Talegenkendelsesmodel
En kode-første introduktion til NLP
En Code-First Introduktion til NLP er et fantastisk kursus af fast.ai, hvis du gerne vil stifte bekendtskab med NLP-området. Dette kursus undervises af Rachel Thomas, og det dækker traditionelle og neurale netværkstilgange til naturlig sprogbehandling.
📋 Forudsætninger
- Python programmering
- Maskinlæringskoncepter
- Neurale netværk med PyTorch (nyttigt, men ikke påkrævet)
Her er en oversigt over, hvad kurset dækker:
💲 Pris: Gratis
NLP med Machine Learning: Pædagogisk
Denne NLP med Machine Learning, af Educative, fokuserer på at gøre eleverne fortrolige med vigtige begreber i NLP. Fra kodning af interviewforberedelser og systemdesign til maskinlæring, Educative er en af de populære online læringsplatforme.
Kurset dækker følgende:
- Ordindlejringer
- Sprogmodeller
- Tekstklassificering
- Seq2seq modeller
NLP i Python: DataCamp
Natural Language Processing i Python af Datacamp er et struktureret færdighedsspor på seks kurser. Disse kurser introducerer eleverne til forskellige aspekter af naturlig sprogbehandling.
📋 Forudsætninger
- Færdighed i Python
- Forståelse af machine learning
Dette spor består af følgende kurser:
NLP kursus: Lena Voita
NLP-kurset er en forlængelse af det naturlige sprogbehandlingskursus, som forfatteren, Lena Voita, underviser på Yandex School of Data Analysis. Kurset er organiseret i sektioner og indeholder interaktive lektioner og blogindlæg. Derudover er der notesbøger og resuméer af forskningsartikler.
- Tekstklassificering (både traditionelle og neurale netværkstilgange)
- Ordindlejringer
- Evaluering af sprogmodeller
- Seq2seq-modeller og opmærksomhed
- Overfør læring til NLP
💲 Pris: Gratis
Konklusion
Jeg håber, at du fandt denne liste over læringsressourcer nyttig. Ud fra forudsætninger og tidsforpligtelse kan du vælge det kursus eller den specialisering, der passer bedst til dine interesser. Når du har opnået grundlæggende viden, skal du sørge for at bygge projekter på datasæt fra den virkelige verden for at supplere og styrke din forståelse. God kodning!👩🏽💻
Tjek derefter listen over datavidenskabelige notesbøger, du kan bruge til dit næste NLP-projekt!