Master i IT, Softwarekonstruktion

Målgruppe

Data Scientists, Predictive Analytics Developers, Hadoop-udviklere o.lign., der ønsker både at beherske teknologierne bag Data Science og Big Data og at kunne udnytte teknologierne til at skabe forretningsmæssig værdi.

Udbytte

Viden:

Gennem fagpakken skal deltagerne opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

Introduktion til data science: begreber, konkrete Big Data-eksempler, muligheder og begrænsninger.

Statistisk dataanalyse:

  • Indlæsning, præprocessering og rensning af data
  • Udforskning af data
  • Brug af statistikværktøjer

Data mining og machine learning metoder til Big Data:

  • Prædiktive metoder såsom regression og klassifikation
  • Deskriptive metoder såsom gruppering af dataobjekter (clustering)
  • Regulariseringsmetoder til behandling af højdimensionelle data.

Big Data-skalering:

  • Principper, modeller og platforme
  • Opsamling, lagring og processering af Big Data
  • Data mining på Big Data

Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.

Færdigheder:

Efter af have gennemført fagpakken skal deltagerne kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete Big Data-problemstillinger. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.

Konkret forventes det, at deltagerne efter gennemførelse af fagpakken er i stand til at:

  • bruge et statistisk værktøj i undersøgelser af større datasæt,
  • forstå, udvælge, anvende og eventuelt kombinere en række data mining og machine learning metoder til vidensopdagelse i både ustrukturerede og strukturerede Big Data-eksempler,
  • designe og implementere et avanceret Big Data-system,
  • skalere det implementerede system på en distribueret platform.

Kompetencer:

Deltagerne skal efter gennemførelse af fagpakken kunne reflektere over metoder, teknikker, teknologier og resultater for et givet Big Data-system, samt hvordan disse kan anvendes i praksis. Herunder

  • træffe informerede valg omkring statistiske metoder,
  • træffe informerede valg omkring anvendelse af avancerede data mining og machine learning teknikker og parametrisering af disse for et konkret Big Data-eksempel,
  • træffe informerede valg omkring avancerede Big Data-teknologier,
  • designe og udvikle et komplet Big Data-system for en kompleks, realistisk problemstilling,
  • formidle og diskutere løsningerne med fagfæller og ikke-specialister.