Data Science med Python - eLearning

4.900,00 NOK

  • 50 hours
eLæring

Kurset "Python for Data Science" dekker grunnleggende programmeringskonsepter med Python og gir forklaringer på dataanalyse, maskinlæring, datavisualisering, web scraping og behandling av naturlig språk. Du vil oppnå en omfattende forståelse av de ulike pakkene og bibliotekene som er nødvendige for å utføre de ulike aspektene ved dataanalyse.

Nøkkelfunksjoner

Språk

Kurset og materialet er på engelsk

Nivå

Nybegynner - mellomnivå

Tilgang

1 års tilgang til den selvstyrte studie e-læringsplattformen 24/7

6 timer med videomateriale

med anbefalt studietid på 40 timer & øvelser

Praksiser

Virtuelle laboratorier, Testsimulering, Avsluttende prosjekter

Ingen eksamen

Ingen eksamen for kurset, men studenten vil få et kursbevis for fullført opplæring

Bonus gratis kurs!

Grunnleggende statistikk for datavitenskap

Hero

Læringsutbytte

Ved slutten av dette e-læringskurset i Data Science med Python, vil du kunne:

Få en grundig forståelse av data science-prosesser, datahåndtering, datautforskning, datavisualisering, hypotesebygging og testing.

Installer det nødvendige Python-miljøet og andre hjelpeverktøy og biblioteker.

Forstå de grunnleggende konseptene i Python-programmering, som datatyper, tupler, lister, grunnleggende operatorer og funksjoner.

Utfør avansert matematisk databehandling ved hjelp av NumPy-pakken og dens omfattende bibliotek av matematiske funksjoner.

Utfør avansert matematisk databehandling ved hjelp av NumPy-pakken og dens omfattende bibliotek av matematiske funksjoner.

Utfør vitenskapelig og teknisk databehandling ved hjelp av SciPy-pakken og dens underpakker, som Integrate, Optimise, Statistics, IO, og Weave.

Utfør dataanalyse og manipulasjon ved hjelp av datastrukturer og verktøy som tilbys i Pandas-pakken.

Skaff deg ekspertise i maskinlæring ved å bruke Scikit-Learn-pakken

Forstå overvåkede og uovervåkede læringsmodeller som lineær regresjon, logistisk regresjon, klyngedannelse, dimensjonsreduksjon, K-NN og rørledning.

Bruk Scikit-Learn-pakken for behandling av naturlig språk.

Bruk matplotlib-biblioteket i Python for data visualisering

Ekstraher verdifulle data fra nettsteder ved å utføre webskraping ved bruk av Python

Integrer Python med Hadoop og MapReduce

Kursinnhold

Hero
  1. Introduksjon til dataanalyse

    Leksjon 01

    • Data Science og dens anvendelser
    • Data Science-prosessen: Del 1
    • Data Science-prosessen: Del 2
  2. Essensielt om Python-programmering

    Leksjon 02

    • Sette opp Jupyter Notebook
    • Python-funksjoner
    • Python-typer og sekvenser
    • Dypdykk i Python-strenger
    • Python-demo: Lesing og skriving av csv-filer
    • Dato og tid i Python
    • Objekter i Python-kart
    • Lambda og listeforståelse
    • Hvorfor Python for dataanalyse?
    • Python-pakker for dataanalyse
    • StatsModels-pakken
    • Scipy-pakken
  3. NumPy

    Leksjon 03

    • Grunnleggende om NumPy
    • Arrayformer og akser i NumPy: Del A
    • NumPy-arrayformer og akser: Del B
    • Aritmetiske operasjoner
    • Betinget logikk
    • Vanlige matematiske og statistiske funksjoner i Numpy
    • Indeksering og skiving
    • Filhåndtering
  4. Lineær algebra

    Leksjon 03

    • Innføring i lineær algebra
    • Skalarer og vektorer
    • Skalarprodukt av to vektorer
    • Lineær uavhengighet av vektorer
    • Normen til en vektor
    • Matriseoperasjoner
    • Rang av en matrise
    • Determinant av en matrise og identitetsmatrise eller operator
    • Invers av en matrise og egenverdier og egenvektorer
    • Kalkulus i lineær algebra
  5. Statistiske grunnprinsipper

    Leksjon 05

    • Betydningen av statistikk med hensyn til dataanalyse
    • Vanlige statistiske termer
    • Statistikkttyper
    • Datakategorisering og typer
    • Målenivåer
    • Sentral tendens
    • Spredningsmål
    • Tilfeldige Variabler
    • Sett
    • Måltall for form (Skjevhet & Kurtose)
    • Kovarians og korrelasjon
  6. Sannsynlighetsfordeling

    Leksjon 06

    • Sannsynlighet, dens betydning, og sannsynlighetsfordeling
    • Sannsynlighetsfordeling: Binomisk fordeling
    • Sannsynlighetsfordeling: Poissonfordeling
    • Sannsynlighetsfordeling: Normalfordeling
    • Sannsynlighetsfordeling: Bernoulli-fordeling
    • Sannsynlighetstetthetsfunksjon og massfunksjon
    • Kumulativ fordelingsfunksjon
    • Sentralgrenseteoremet
    • Estimeringsteori
  7. Avansert statistikk

    Leksjon 07

    • Distribusjon
    • Kurtosis, skjevhet og Students t-fordeling
    • Hypotesetesting og mekanisme
    • Hypotesetestresultater: Type I- og II-feil
    • Nullhypotese og alternativ hypotese
    • Konfidensintervaller
    • Feilmarginer
    • Sammenligne og kontrastere T-test og Z-test
    • Bayes' teorem
    • Khi-kvadratfordeling
    • Chi Square-test og tilpasningsgodhet
    • Analyse av varians eller ANOVA
    • ANOVA-terminologi
    • Partisjonering av varians ved bruk av Python
    • F - distribusjon ved bruk av Python
    • F - Test
  8. Pandaer

    Leksjon 08

    • Pandas-serier
    • Forespør en serie
    • Pandas Dataframes
    • Pandas Panel
    • Vanlige funksjoner i Pandas
    • Pandas-funksjoner Data Statistiske Funksjoner, Vindusfunksjon
    • Pandas-funksjon Data og Tidsdifferanse
    • Kategoriske data
    • Arbeide med tekstdata
    • Iterasjon
    • Sortering
    • Plottlaging med Pandas
  9. Dataanalyse

    Leksjon 09

    • Forståelse av data
    • Typer av data: Strukturerte Ustrukturerte Rotete osv
    • Arbeid med data Valg av passende verktøy, Datainnsamling, Datahåndtering
    • Import og eksport av data i Python
    • Regulære uttrykk i Python
    • Manipulering av tekst med regulære uttrykk
    • Tilgang til databaser i Python
  10. Datahåndtering

    Leksjon 10

    • Sjarmerende eller idiomatisk Pandas-kode
    • Laster indeksering og reindeksering
    • Fusjonering
    • Minneoptimalisering i Python
    • Forbehandling av data: Innlasting av data og fjerning av nullverdier
    • Forbehandling av data Fylling av nullverdier
    • Datainndeling, formatering og normalisering
    • Standardisering av datagruppering
    • Beskrive data
  11. Data Visualisering

    Leksjon 11

    • Prinsipper for informasjonsvisualisering
    • Visualisering av data ved bruk av pivottabeller
    • Biblioteker for datavisualisering i Python: Matplotlib
    • Graftyper
    • Biblioteker for datavisualisering i Python: Seaborn, Plotly, Bokeh
    • Bruke Matplotlib til å tegne grafer
    • Plott 3D-grafer for flere kolonner ved bruk av Matplotlib
    • Bruke Matplotlib med andre Python-pakker
    • Bruke Seaborn til å tegne grafer
    • Plott 3D-grafer for flere kolonner ved bruk av Seaborn
    • Introduksjon til Plotly og Bokeh
  12. Grunnleggende statistikk for datavitenskap

    Bonus gratis kurs!

    • Introduksjon til statistikk
    • Forstå data
    • Beskrivende statistikk
    • Datavisualisering
    • Sannsynlighet
    • Sannsynlighetsfordelinger
    • Prøvetaking og prøvetakingsteknikker
    • Inferensiell statistikk
    • Anvendelse av inferensiell statistikk
    • Sammenheng mellom variabler
    • Anvendelse av statistikk i næringslivet
    • Assistert praksi

Kursprosjekt

Kurset inkluderer også praktiske, bransjebaserte prosjekter. Vellykket gjennomføring av ett av følgende prosjekter er en del av opptakskravene:

Prosjekt 1: Analyse av detaljhandel for strategisk planlegging

Undersøk salgsdata fra en klesforretning for å hjelpe ledelsen med å utforme effektive strategier for salgsvekst og forretningsutvidelse.

Prosjekt 2: Evaluering av effektiviteten av markedsføringskampanjer

Gjennomfør utforskende dataanalyse og hypotesetesting for å identifisere nøkkelfaktorer som påvirker kunderekruttering og kampanjens suksess.

Prosjekt 3: Visuell utforskning av eiendomsdata

Bruk ulike visualiseringsteknikker til å analysere et eiendomsdatasett og trekke ut meningsfulle innsikter.

Prosjekt 4: Studie av boligmarkedspriser

Undersøk boligmarkedsdata for å avdekke trender i eiendomspriser, forstå driverne bak prisingen og vurdere hvordan ulike boligegenskaper påvirker verdien.

Prosjekt 5: Analyse av kundens atferdsmønstre

Bruk sannsynlighetsfordelinger til å studere kundeatferd og evaluere butikkens ytelse ved hjelp av et tilpasset datasett.

dataforsker med python

Hvem bør melde seg på dette programmet?

Dette kurset er ideelt for personer som er interessert i å forfølge en karriere innen datavitenskap, maskinlæring eller kunstig intelligens, og som ønsker å forbedre sine ferdigheter innen Python-programmering og dataanalyse.

Aspirerende dataforskere

Dataanalytikere

Programvareingeniører eller programmerere

Forskere og akademikere

Maskinlæringsentusiaster

Studenter og nyutdannede

Start kurset nå

Forutsetninger

Studenter må ha en bachelorgrad eller et vitnemål fra videregående skole. I tillegg oppmuntres en nysgjerrighet for dataanalyse og et ønske om å utforske bruken av Python innen datavitenskap. Det anbefales også å ha:

  • Grunnleggende kunnskap om Python-programmering: Kjennskap til grunnleggende programmeringskonsepter i Python som variabler, løkker, funksjoner og kontrollflyt.
  • Grunnleggende forståelse av statistikk: En grunnleggende forståelse av statistikk, inkludert konsepter som gjennomsnitt, median, standardavvik, sannsynlighet og korrelasjon.
  • Matematikk: Grunnleggende matematikkferdigheter, spesielt innen områder som algebra og lineær algebra, vil være nyttige, spesielt når man jobber med maskinlæringsalgoritmer eller modeller.

Ofte stilte spørsmål

Trenger du bedriftsløsning eller LMS-integrasjon?

Fant du ikke kurset eller programmet som ville være passende for din bedrift? Trenger du LMS-integrasjon? Ta kontakt med oss! Vi er agile og løser alt!