Data Science med Python - eLearning
4.900,00 NOK
- 50 hours
Kurset "Python for Data Science" dekker grunnleggende programmeringskonsepter med Python og gir forklaringer på dataanalyse, maskinlæring, datavisualisering, web scraping og behandling av naturlig språk. Du vil oppnå en omfattende forståelse av de ulike pakkene og bibliotekene som er nødvendige for å utføre de ulike aspektene ved dataanalyse.
Nøkkelfunksjoner
Språk
Kurset og materialet er på engelsk
Nivå
Nybegynner - mellomnivå
Tilgang
1 års tilgang til den selvstyrte studie e-læringsplattformen 24/7
6 timer med videomateriale
med anbefalt studietid på 40 timer & øvelser
Praksiser
Virtuelle laboratorier, Testsimulering, Avsluttende prosjekter
Ingen eksamen
Ingen eksamen for kurset, men studenten vil få et kursbevis for fullført opplæring
Bonus gratis kurs!
Grunnleggende statistikk for datavitenskap

Læringsutbytte
Ved slutten av dette e-læringskurset i Data Science med Python, vil du kunne:
Få en grundig forståelse av data science-prosesser, datahåndtering, datautforskning, datavisualisering, hypotesebygging og testing.
Installer det nødvendige Python-miljøet og andre hjelpeverktøy og biblioteker.
Forstå de grunnleggende konseptene i Python-programmering, som datatyper, tupler, lister, grunnleggende operatorer og funksjoner.
Utfør avansert matematisk databehandling ved hjelp av NumPy-pakken og dens omfattende bibliotek av matematiske funksjoner.
Utfør avansert matematisk databehandling ved hjelp av NumPy-pakken og dens omfattende bibliotek av matematiske funksjoner.
Utfør vitenskapelig og teknisk databehandling ved hjelp av SciPy-pakken og dens underpakker, som Integrate, Optimise, Statistics, IO, og Weave.
Utfør dataanalyse og manipulasjon ved hjelp av datastrukturer og verktøy som tilbys i Pandas-pakken.
Skaff deg ekspertise i maskinlæring ved å bruke Scikit-Learn-pakken
Forstå overvåkede og uovervåkede læringsmodeller som lineær regresjon, logistisk regresjon, klyngedannelse, dimensjonsreduksjon, K-NN og rørledning.
Bruk Scikit-Learn-pakken for behandling av naturlig språk.
Bruk matplotlib-biblioteket i Python for data visualisering
Ekstraher verdifulle data fra nettsteder ved å utføre webskraping ved bruk av Python
Integrer Python med Hadoop og MapReduce
Kursinnhold

Introduksjon til dataanalyse
Leksjon 01
- Data Science og dens anvendelser
- Data Science-prosessen: Del 1
- Data Science-prosessen: Del 2
Essensielt om Python-programmering
Leksjon 02
- Sette opp Jupyter Notebook
- Python-funksjoner
- Python-typer og sekvenser
- Dypdykk i Python-strenger
- Python-demo: Lesing og skriving av csv-filer
- Dato og tid i Python
- Objekter i Python-kart
- Lambda og listeforståelse
- Hvorfor Python for dataanalyse?
- Python-pakker for dataanalyse
- StatsModels-pakken
- Scipy-pakken
NumPy
Leksjon 03
- Grunnleggende om NumPy
- Arrayformer og akser i NumPy: Del A
- NumPy-arrayformer og akser: Del B
- Aritmetiske operasjoner
- Betinget logikk
- Vanlige matematiske og statistiske funksjoner i Numpy
- Indeksering og skiving
- Filhåndtering
Lineær algebra
Leksjon 03
- Innføring i lineær algebra
- Skalarer og vektorer
- Skalarprodukt av to vektorer
- Lineær uavhengighet av vektorer
- Normen til en vektor
- Matriseoperasjoner
- Rang av en matrise
- Determinant av en matrise og identitetsmatrise eller operator
- Invers av en matrise og egenverdier og egenvektorer
- Kalkulus i lineær algebra
Statistiske grunnprinsipper
Leksjon 05
- Betydningen av statistikk med hensyn til dataanalyse
- Vanlige statistiske termer
- Statistikkttyper
- Datakategorisering og typer
- Målenivåer
- Sentral tendens
- Spredningsmål
- Tilfeldige Variabler
- Sett
- Måltall for form (Skjevhet & Kurtose)
- Kovarians og korrelasjon
Sannsynlighetsfordeling
Leksjon 06
- Sannsynlighet, dens betydning, og sannsynlighetsfordeling
- Sannsynlighetsfordeling: Binomisk fordeling
- Sannsynlighetsfordeling: Poissonfordeling
- Sannsynlighetsfordeling: Normalfordeling
- Sannsynlighetsfordeling: Bernoulli-fordeling
- Sannsynlighetstetthetsfunksjon og massfunksjon
- Kumulativ fordelingsfunksjon
- Sentralgrenseteoremet
- Estimeringsteori
Avansert statistikk
Leksjon 07
- Distribusjon
- Kurtosis, skjevhet og Students t-fordeling
- Hypotesetesting og mekanisme
- Hypotesetestresultater: Type I- og II-feil
- Nullhypotese og alternativ hypotese
- Konfidensintervaller
- Feilmarginer
- Sammenligne og kontrastere T-test og Z-test
- Bayes' teorem
- Khi-kvadratfordeling
- Chi Square-test og tilpasningsgodhet
- Analyse av varians eller ANOVA
- ANOVA-terminologi
- Partisjonering av varians ved bruk av Python
- F - distribusjon ved bruk av Python
- F - Test
Pandaer
Leksjon 08
- Pandas-serier
- Forespør en serie
- Pandas Dataframes
- Pandas Panel
- Vanlige funksjoner i Pandas
- Pandas-funksjoner Data Statistiske Funksjoner, Vindusfunksjon
- Pandas-funksjon Data og Tidsdifferanse
- Kategoriske data
- Arbeide med tekstdata
- Iterasjon
- Sortering
- Plottlaging med Pandas
Dataanalyse
Leksjon 09
- Forståelse av data
- Typer av data: Strukturerte Ustrukturerte Rotete osv
- Arbeid med data Valg av passende verktøy, Datainnsamling, Datahåndtering
- Import og eksport av data i Python
- Regulære uttrykk i Python
- Manipulering av tekst med regulære uttrykk
- Tilgang til databaser i Python
Datahåndtering
Leksjon 10
- Sjarmerende eller idiomatisk Pandas-kode
- Laster indeksering og reindeksering
- Fusjonering
- Minneoptimalisering i Python
- Forbehandling av data: Innlasting av data og fjerning av nullverdier
- Forbehandling av data Fylling av nullverdier
- Datainndeling, formatering og normalisering
- Standardisering av datagruppering
- Beskrive data
Data Visualisering
Leksjon 11
- Prinsipper for informasjonsvisualisering
- Visualisering av data ved bruk av pivottabeller
- Biblioteker for datavisualisering i Python: Matplotlib
- Graftyper
- Biblioteker for datavisualisering i Python: Seaborn, Plotly, Bokeh
- Bruke Matplotlib til å tegne grafer
- Plott 3D-grafer for flere kolonner ved bruk av Matplotlib
- Bruke Matplotlib med andre Python-pakker
- Bruke Seaborn til å tegne grafer
- Plott 3D-grafer for flere kolonner ved bruk av Seaborn
- Introduksjon til Plotly og Bokeh
Grunnleggende statistikk for datavitenskap
Bonus gratis kurs!
- Introduksjon til statistikk
- Forstå data
- Beskrivende statistikk
- Datavisualisering
- Sannsynlighet
- Sannsynlighetsfordelinger
- Prøvetaking og prøvetakingsteknikker
- Inferensiell statistikk
- Anvendelse av inferensiell statistikk
- Sammenheng mellom variabler
- Anvendelse av statistikk i næringslivet
- Assistert praksi
Kursprosjekt
Kurset inkluderer også praktiske, bransjebaserte prosjekter. Vellykket gjennomføring av ett av følgende prosjekter er en del av opptakskravene:
Prosjekt 1: Analyse av detaljhandel for strategisk planlegging
Undersøk salgsdata fra en klesforretning for å hjelpe ledelsen med å utforme effektive strategier for salgsvekst og forretningsutvidelse.
Prosjekt 2: Evaluering av effektiviteten av markedsføringskampanjer
Gjennomfør utforskende dataanalyse og hypotesetesting for å identifisere nøkkelfaktorer som påvirker kunderekruttering og kampanjens suksess.
Prosjekt 3: Visuell utforskning av eiendomsdata
Bruk ulike visualiseringsteknikker til å analysere et eiendomsdatasett og trekke ut meningsfulle innsikter.
Prosjekt 4: Studie av boligmarkedspriser
Undersøk boligmarkedsdata for å avdekke trender i eiendomspriser, forstå driverne bak prisingen og vurdere hvordan ulike boligegenskaper påvirker verdien.
Prosjekt 5: Analyse av kundens atferdsmønstre
Bruk sannsynlighetsfordelinger til å studere kundeatferd og evaluere butikkens ytelse ved hjelp av et tilpasset datasett.

Hvem bør melde seg på dette programmet?
Dette kurset er ideelt for personer som er interessert i å forfølge en karriere innen datavitenskap, maskinlæring eller kunstig intelligens, og som ønsker å forbedre sine ferdigheter innen Python-programmering og dataanalyse.
Aspirerende dataforskere
Dataanalytikere
Programvareingeniører eller programmerere
Forskere og akademikere
Maskinlæringsentusiaster
Studenter og nyutdannede
Forutsetninger
Studenter må ha en bachelorgrad eller et vitnemål fra videregående skole. I tillegg oppmuntres en nysgjerrighet for dataanalyse og et ønske om å utforske bruken av Python innen datavitenskap. Det anbefales også å ha:
- Grunnleggende kunnskap om Python-programmering: Kjennskap til grunnleggende programmeringskonsepter i Python som variabler, løkker, funksjoner og kontrollflyt.
- Grunnleggende forståelse av statistikk: En grunnleggende forståelse av statistikk, inkludert konsepter som gjennomsnitt, median, standardavvik, sannsynlighet og korrelasjon.
- Matematikk: Grunnleggende matematikkferdigheter, spesielt innen områder som algebra og lineær algebra, vil være nyttige, spesielt når man jobber med maskinlæringsalgoritmer eller modeller.
Ofte stilte spørsmål

Trenger du bedriftsløsning eller LMS-integrasjon?
Fant du ikke kurset eller programmet som ville være passende for din bedrift? Trenger du LMS-integrasjon? Ta kontakt med oss! Vi er agile og løser alt!