Kandidat - Datavidenskab - Aalborg Universitet
Optagelse på kandidatuddannelsen i datavidenskab forudsætter en af følgende bacheloruddannelser:
· Bachelor i datavidenskab fra Aalborg Universitet (retskrav)
· Bacheloruddannelse i data science (det tekniske spor) fra IT Universitetet.
Kandidatuddannelsen i datavidenskab (også kaldet ”data science”) har som sit mål at give en dyb faglig indsigt i faget datavidenskab, avancerede datatyper, teorier og modeldannelser og de teknologiske muligheder. Der indsamles og gemmes i dag enorme mængder data fra forskellige systemer, netværk, sensorer m.m. Der er nu tale om meget store og forskelligartede datamængder, som genereres hurtigt, såkaldt Big Data[1]. Det er bredt anerkendt, at der er store potentialer i at udnytte Big Data til at opdage ellers skjulte sammenhænge, lave forudsigelser og korrigerende handlinger. Det er dog en stor udfordring at gøre dette i praksis, da det kræver både stærke IT-tekniske kundskaber og stærke matematiske/statistiske kundskaber. Dette er netop, hvad uddannelsen i datavidenskab tilbyder. En kandidat i datavidenskab får en stærk baggrund i forhold til programmering og håndtering/processering af data samt avanceret statistisk analyse af store og komplekse datamængder. Populært sagt har en kandidat i datavidenskab markant bedre kundskaber inden for statistik og maskinlæring end en datalog samt markant bedre kundskaber inden for programmering og håndtering af store data end en statistiker. Uddannelsen giver de studerende tværfaglige kompetencer, der kræves til analyse af Big Data. Der er således særdeles gode muligheder for beskæftigelse med dataanalyse og datahåndtering, hvilket bruges både i organisationer fra de offentlige og private sektorer. Der er allerede et stort, men udækket, behov for profiler med de kompetencer uddannelsen i datavidenskab tilbyder, som beskrevet under Kriterium 1 senere.
Efter gennemført studium skal en kandidat i datavidenskab derfor have opnået dyb viden om teori, metode og praksis inden for analyse af store datamængder og kunne forstå og reflektere over fagets teorier, metoder og praksis. På udvalgte områder er kandidatens viden baseret på højeste internationale forskning inden for faget. En kandidat i datavidenskab kan anvende avancerede metoder og redskaber fra datalogi og matematik til at designe, implementere og forstå analyser af store komplekse datamængder, kan vurdere teoretiske og praktiske problemstillinger inden for datavidenskab og begrunde og vælge relevante løsningsmodeller ud fra kendskab til de muligheder og begrænsninger, som er givet af datalogiens og matematikkens teorier og metoder.
Kandidatuddannelsen i datavidenskab vil være forankret på Skole for Informations- og Kommunikationsteknologi, hvor den primære undervisning rekvireres hos Institut for Datalogi. I løbet af uddannelsen vil der være samarbejde med Institut for Matematiske Fag til varetagelse af matematik- og statistikundervisning. Uddannelsen faciliterer samarbejde omkring studenterprojekter og kursusaktiviteter med flere forskellige fagmiljøer på tværs af fakulteter, f.eks. medialogi, elektronik, bio-tech, energi og transport samt med Aalborg Universitetshospital.
Under forudsætning af fornøden godkendelse, ventes første optag på uddannelsen i september 2022 (3 år efter første forventede optag på bacheloruddannelsen i datavidenskab, som der også ansøges om godkendelse til at oprette).
Uddannelsen er tilrettelagt som en sammenhængende uddannelse med en naturlig faglig progression, som kan gennemføres inden for den fastsatte tidsramme på 2 år. Uddannelsen består af 120 ECTS-point, fordelt på 4 semestre à 30 ECTS-point. De to første semestre består af et projektmodul og tre kursusmoduler. Det tredje semester består af et større projektmodul på 20 ECTS-point og to kursusmoduler. Det fjerde og sidste semester består af et kandidatspeciale. Kursusmodulerne giver den studerende viden, færdigheder og kompetencer til at arbejde med metode og teori inden for et afgrænset område, mens projektmodulerne vil sætte dette i en tværfaglig problemorienteret kontekst, hvor viden, færdigheder og kompetencer anvendes på en måde svarende til anvendelsen i industrien. Industrielt relevante problemstillinger vil udgøre grundlaget for projekterne, og disse udføres ofte i tæt samarbejde med både danske og internationale virksomheder.
Kandidatuddannelsen i datavidenskab er tilrettelagt med et fagligt indhold, der dækker fremtidens behov og har som sit mål at give en velfunderet indsigt i faget datavidenskab, dets teorier og modeldannelser og de teknologiske muligheder. Dette afspejles i opbygningen af uddannelsen og fokus. På 1. semester omhandler projektmodulet opdagelse af viden fra data, og på 2. semester omhandler projektmodulet data-intensive cyber-fysiske systemer. På begge disse semestre vælger den studerende tre af de udbudte kurser. På 3. semester begynder den studerende på specialiseringsåret, hvor der på 3. semester fokuseres på faglig bredde og 4. semester på faglig dybde. På 3. semester vælger den studerende to af de udbudte kurser, mens der på 4. semester ikke er kursusaktiviteter.
Nedenfor beskrives uddannelsens konstituerende elementer, herunder titel, antal ECTS-point og beskrivelse af mål og indhold for hvert modul. Se desuden den vedlagte studieordning for kandidatuddannelsen i datavidenskab (bilag 5).
1. semester (den studerende vælger tre kursusmoduler)
Modul 1.1: Avanceret Web Data Science (5 ECTS-point)
En bred vifte af moderne industri- og forskningsapplikationer processerer webdata på forskellige måder. Disse applikationer kræver sofistikerede teknikker, der bygger på de seneste forskningsresultater. Dette kursus vil give en dyb indsigt og færdigheder i emner relevante for at udvikle avancerede metoder til webdatavidenskab. Kurset vil bl.a. dække metoder og teknikker til processering af webdata – inkl. forespørgsler på og udtrækning af webdata, semantisk data og reasoning, grafbaserede metoder, prædiktiv analyse, processering af naturligt sprog, analytics af data fra web og sociale medier, web-ranking og -scoring, recommender-systemer, kvalitet af webdata osv.
Modul 1.2: Netværks- & produktionsdata (5 ECTS-point)
En særlig udfordring i dataanalyse er analyse af data genereret af komplekse systemer. Disse systemer udviser ofte en kompleks (netværks)struktur (f.eks. computer- eller sensornetværk, biologiske netværk, sociale netværk) og genererer strømme af temporale data (f.eks. industrielt produktionsdata, status fra komponenter i Internet of Things). Dette kursus introducerer de studerende til de matematiske fundamenter og praktiske teknikker til håndtering af disse komplekse data.
Modul 1.3: Process Mining (5 ECTS-point)
Datalagring og dataanalyse er nøglebegreber i datavidenskab, men for at kunne forbedre analyseteknikkerne bør en kandidat også forstå de operationelle processer, som producerer data. Process mining bygger bro mellem datacentriske teknikker såsom data mining og maskinlæring og de traditionelle procesbaserede modeller. I dette kursus bliver de studerende introduceret til basale procesmodeller og de analyseteknikker, som muliggør undersøgelse af processernes opførsel. Derudover vil forskellige teknikker til procesopdagelse blive studeret med et særligt fokus på eventlogs, som indeholder støj og/eller er ufuldstændige. De studerende vil lære om conformance testing og alignment mellem procesmodeller såvel som teknikker til process mining i stor skala og mulige udvidelser med kvantitative aspekter såsom tid og sandsynlighed. Endelig vil de studerende opnå praktisk erfaring med brug af et udvalg af værktøjer til process mining og procesanalyse.
Modul 1.4: Emner inden for statistisk videnskab I (5 ECTS-point)
I kurset præsenteres udvalgte emner fra de statistiske videnskaber på et avanceret niveau. De studerende, som gennemfører modulet, vil have opnået en introducerede forståelse af emner så som: EM-algoritmen, der benyttes til parameterestimering i tilfælde af manglende data og ikke-komplette observationer samt ved modeller med latente variable; faktoranalyse, som benyttes til at reducere antallet af variable i regressionssetup ved at antage en række latente variable (faktorer) kan forklare den systematiske variation i data; dynamiske lineære modeller, herunder Kalman-filteret og State-Space modeller, som benyttes til at modellere fænomener, der observeres henover tid med en tidsmæssig afhængighed til følge; bayesianske netværk, der benyttes til at formalisere betingede afhængigheder mellem variable, hvoraf indflydelsen af og imellem disse variable kan studeres. I visse tilfælde kan bayesianske netværk også benyttes til at modellere kausale sammenhænge.
Modul 1.5: Semesterprojekt: Opdagelse af viden fra data (15 ECTS-point)
Store datamængder, f.eks. fra web- og produktionssystemer, indeholder ofte viden, som ikke er umiddelbart synlig. Denne projektenhed giver den studerende erfaring med design og udvikling af en løsning til at udtrække og synliggøre viden fra en realistisk problemstilling, f.eks. fra web-, produktions- eller forretningsdata.
2. semester (den studerende vælger tre kursusmoduler)
Modul 2.1: Avanceret (statistisk) maskinlæring (5 ECTS-point)
I dette kursusmodul vil de studerende tilegne sig viden om generelle modeller og metoder inden for moderne maskinindlæring. Modulet bygger videre på grundlæggende maskinindlæringsteknikker. I modulet præsenteres udvalgte modeller, teknikker og principper, der knytter sig til forskellige områder inden for maskinindlæring. Dette inkluderer f.eks. lineære modeller, dybe (neurale) netværk, support vektormaskiner, grafiske modeller, og gaussiske processer. Ved kursets afslutning vil den studerende have kendskab til en bred vifte af moderne metoder og principper inden for maskinindlæring, og være i stand til at vurdere metodernes anvendelighed i forhold til konkrete og realistiske problemområder.
Modul 2.2: Avancerede typer data (5 ECTS-point)
I dette kursus arbejder de studerende med processering af (inkl. integration, forespørgsel, analyse og udforskning) avancerede typer data såsom GPS trajectory data, temporale data, og tidsseriedata. Ved brug af kommende og de-facto standarder for avancerede datatyper bliver de studerende introduceret til de formelle egenskaber af forskellige typer af data. De studerende får et overblik over teknikkerne til at processere data og bliver introduceret til softwareværktøjer anvendt til at processere data. Kurset dækker et antal typer af data med vigtige anvendelser i praksis. Eksempler på avancerede datatyper er: Spatio-temporale data, (f.eks. GPS trajectories); temporale data (såsom finansielle data); tidsserier (såsom Dow-Jones Industrial Average) og tidsafhængige og usikre grafer.
Modul 2.3: Videnskabelige beregninger og sensormodellering (5 ECTS-point)
I dette kursus bliver de studerende i stand til at implementere programmer til at løse videnskabelige beregningstunge problemer vha. parallelisme. De studerende bliver i stand til at fejlfinde, validere, optimere, benchmarke og profilere udviklede softwaremoduler. De studerende vil være i stand til at vurdere performance af forskellige hardwarearkitekturer til videnskabelige beregninger. De studerende vil være i stand til at bruge sensormodeller i systemsimulering.
Modul 2.4: Billedbehandling & Computer Vision (5 ECTS-point)
Kameraer indfanger visuelle data fra omgivelserne. For at bygge systemer, der automatisk kan processere sådanne data, kræves metoder fra computer vision. I dette kursus vil de studerende komme til at forstå essensen af digitale billeder og video og få indsigt i relevante teorier og metoder inden for computer vision samt forståelse for deres anvendelighed.
Modul 2.5: Avancerede algoritmer (5 ECTS-point)
Avanceret analyse af store mængder af data kræver effektive algoritmer og datastrukturer. Dette kursus giver de studerende viden om og færdigheder med de mest brugte teknikker til algoritmedesign og algoritmeanalyse. Del-og-hersk algoritmer, grådige algoritmer, dynamisk programmering, back-tracking, forgren-og-begræns algoritmer, plane-sweep algoritmer, approksimative algoritmer og amortiseret analyse er eksempler på dækkede emner. Desuden bliver en samling af konkrete kernealgoritmer og datastrukturer fra forskellige datalogiske områder introduceret: algoritmer til ekstern hukommelse, flere-trådede algoritmer, søgning i tekst, avanceret grafalgoritmer og geometriske beregninger. I dette kursus lærer de studerende at genkende en række problemer fra forskellige datalogiske områder og udvælge de mest passende algoritmer og datastrukturer til at løse dem.
Modul 2.6: Semesterprojekt: Dataintensive cyber-fysiske systemer (15 ECTS-point)
I cyber-fysiske systemer overvåges og styres den fysiske virkelighed vha. store datamængder fra sensorer og computere i et netværk. Dette projektmodul giver den studerende erfaring med design og udvikling af en løsning til håndtering og analyse af data fra en realistisk problemstilling fra et cyber-fysisk system, f.eks. fra anvendelsesområderne energi eller trafik.
3. semester (den studerende vælger to kursusmoduler)
Modul 3.1: Infrastruktur til Big Data-systemer (5 ECTS-point)
Teknologien bag Big Data systemer bygger på komponenter af programmeringsteknologi, parallelle og distribuerede systemer. Dette modul giver den studerende dyb indsigt i teknikker for kompilering og compilerstruktur, programanalyse og optimeringer, parallelisering og distribuerede systemer, inklusiv mobil kode, samt interfacet til operativsystemer.
Modul 3.2: Avancerede distribuerede systemer (5 ECTS-point)
Distribueret beregning er en vigtig teknologi til processering af store datamængder. I dette kursus lærer de studerende vigtige principper for og teknikker til infrastruktur, programmering samt analyse af distribuerede og indlejrede systemer. Kurset dækker emner såsom grid og cloud computing, programmering af indlejrede systemer, distribuerede algoritmer samt test og verifikation af distribuerede systemer.
Modul 3.3: Emner i statistisk videnskab II (5 ECTS-point)
I kurset præsenteres udvalgte emner fra de statistiske videnskaber på et avanceret niveau. De studerende opnår en grundlæggende forståelse af emner såsom: Generaliserede Lineære Modeller (GLM), som udvider den ordinære lineære model; Penalised regression, som dækker over metoderne ridge regression, LASSO og deres konvekse kombination: Elastisk Net. Penalised regression tilføjer en straf på normen af parametervektoren i regressionssammenhæng, hvoraf en sparse løsning identificeres; Generalised Estimation Equations (GEE) og quasi Likelihood (qL) benyttes til estimering og modellering af fænomener, som ikke kan modelleres vha. de eksponentielle familiefordelinger; ikke-lineær regression (NLS) giver mulighed for at modellere systemer, som f.eks. har eksponentiel vækst, og hvor transformation af modellen ikke beskriver data og fejlkomponenten tilstrækkeligt.
Modul 3.4: Entreprenørskab (5 ECTS-point)
Den studerende opnår i dette modul viden om IT-relateret iværksætteri og forretningsudvikling, herunder typisk: forskellige videnskabelige tilgange til entreprenørskab, herunder effectuation, intra-/entreprenørskab , konkurrence- og markedsvilkår, forretningsmodeller og -planer, intellectual property rights, markedsudvikling og -føring, vækststrategier. Den studerende vil kunne formulere, udvikle og præsentere egne IT-relaterede forretningsideer over for et fagligt kvalificeret publikum.
Modul 3.5: Semesterprojekt: Forspeciale (20 ECTS-point)
Den studerende skal på kandidatuddannelsens 3. semester opnå dybtgående indsigt i forskningens aktuelle problemstillinger og metoder.
Igennem projektet på 3. semester får den studerende indsigt i og skal formidle et aktuelt forskningsproblem inden for datavidenskab, således at den studerende på 4. semester kan lave sit specialeprojekt på baggrund heraf.
4. semester
Modul 4.1: Semesterprojekt: Speciale (30 ECTS-point)
Universitetsuddannelser er forskningsbaserede uddannelser; alle studerende skal på kandidatuddannelsen opnå dybtgående indsigt i forskningens aktuelle problemstilling og metoder, således at denne indsigt kan bringes til anvendelse i løsning af åbne forskningsproblemer, typisk med afsæt i realistiske/praktiske problemstillinger. Den studerende skal efter gennemført projektmodul kunne anvende begreberne og ræsonnementerne inden for fagområdet til at formulere, analysere og bidrage til løsning af et problem inden for en aktuel problemstilling i datavidenskabelig forskning.
Takst 3.
Det globale perspektiv
Behovet for dimittender i datavidenskab er globalt set enormt. F.eks. skriver Forbes[1], at IBM forudser, at ”By 2020 the number of Data Science and Analytics job listings is projected to grow by nearly 364,000 listings to approximately 2,720,000”.
Epinion har i sommeren 2017 udarbejdet en analyse af behovet for dimittender i datavidenskab (bilag 1). Epinion har interviewet 141 virksomheder fra forskellige brancher (se populationsbeskrivelse i afsnit 5.1.2 i bilag 1) og desuden dybdeinterviewet 9 virksomheder (se liste over udvalgte virksomheder i afsnit 5.2.2 i bilag 1). Epinions behovsanalyse (bilag 1) drager tilsvarende konklusioner: ”Samme tendens [som i Danmark] til mangel ses i andre vestlige lande. En række nøgleindikatorer på flaskehalse og mangelsituationer, herunder beskæftigelsesfremgang, reallønsstigninger, faldende ledighed samt arbejdsgiveres oplevelse af ikke at kunne besætte stillinger, peger således på en voksende mangel på eksperter i datavidenskab i såvel USA som i adskillige EU-lande." (bilag 1, s. 9).
Da det internationale behov for dimittender er nærmest umætteligt, kan danske virksomheder kun i begrænset omfang få dækket deres behov ved at rekruttere i udlandet. Derfor er danske universiteter nødt til at opruste på uddannelsesfronten i datavidenskab.
Det nationale perspektiv
Det nationale behov for dimittender med kvalifikationer i datavidenskab er blevet grundigt undersøgt af Epinion. Baseret på en spørgeskemaundersøgelse blandt 141 danske virksomheder (se populationsbeskrivelse i afsnit 5.1.2 i bilag 1) konkluderes det: “Spørgeskemaundersøgelsen blandt aftagervirksomheder viser, at 88 % af virksomhederne aktuelt har behov for medarbejdere, der har kompetencer inden for analyse og håndtering af store/komplekse datamængder. 49 % har i høj grad dette behov. Ca. samme andel svarer, at de har behov for denne type medarbejdere i 2020 (om 3 år).” (bilag 1, s. 10).
Ved at ekstrapolere til det nationale niveau estimerer Epinion en mangel på 500-800 dimittender i datavidenskab i 2025.
Dette understreger i særdeleshed, at der på arbejdsmarkedet såvel i dag som i 2020 vil være et udtalt behov for dimittender i datavidenskab, idet der netop på bacheloruddannelsen i datavidenskab er fokus på statistik, analyse og behandling af komplekse datakilder, programmering, it-sikkerhed og etik samt datalogiske teorier.
Der eksisterer på nuværende tidspunkt ikke en kandidatuddannelse i datavidenskab, eller en uddannelse som giver de samme kompetencer indenfor datavidenskab. (Dette vil uddybes nærmere nedenfor.)
Det regionale perspektiv
Epinion konkluderer: ”På regionalt plan opleves der størst behov i Hovedstaden (93 % og 63 % i høj grad) og Syddanmark (93 % og 34 % i høj grad), men der er også et stort behov i Region Sjælland (88 % og 50 % i høj grad), Nordjylland (86 % og 57 % i høj grad) og Midtjylland (75 % og 31 % i høj grad).” (bilag 1, s. 11).
Denne konklusion understreger, at der er et stort behov for uddannelser i datavidenskab i hele landet. Der findes allerede tilbud i Hovedstadsområdet, men efterspørgslen er langt større end kapaciteten. I den øvrige del af landet er der også et stort, udækket behov for dimittender i datavidenskab, og der er derfor behov for uddannelsestilbud i datavidenskab i Vestdanmark. Her er Aalborg Universitet (AAU) en oplagt udbyder pga. de stærke faglige miljøer i datalogi og statistik og de store regionale behov i Nordjylland.
I november 2016 blev forslaget om at oprette en datavidenskabsuddannelse præsenteret for aftagerpanelet for Skole for Informations- og Kommunikationsteknologi på AAU (bilag 2). Forslaget blev meget positivt modtaget af aftagerne. Aftagerne oplever allerede et voksende og udækket behov for personale med datavidenskabskompetencer. En af aftagervirksomhederne fortalte, at de nu må sende ansatte på uddannelsesforløb i udlandet for at kunne dække behovet det voksende marked. I juni 2017 blev et mere detaljeret forslag præsenteret for aftagergruppen for Studienævn for Datalogi (bilag 3). Igen var der stor opbakning til at lave en uddannelse i datavidenskab på baggrund af et allerede eksisterende samt voksende behov. Som et resultat af dialogen med aftagerne er bacheloruddannelsens sammensætning blevet tilpasset for at imødekomme ønsker og behov. ITU har desuden i forbindelse med ansøgning om prækvalifikation af bachelor i Data Science den 3. oktober 2016 dokumenteret, at der over en periode på tre måneder i foråret 2016 var 270 stillingsopslag, hvor en decideret datavidenskabsprofil var krævet. Som et eksempel på det udækkede behov var der den 21. juli 2017 56 stillingsopslag for ”data scientists” i Danmark. Da der i Nordjylland er en stærk IKT-klynge med mange både små og større virksomheder, vurderer vi også, at der er et stort regionalt behov, hvilket også understøttes af Epinions behovsanalyse (bilag 1).
Lav ledighed for beslægtede uddannelser
For de relaterede AAU-uddannelser i Datalogi og Matematik er der meget lav ledighed for dimittender (hhv. 2,3 % og 2,5 % gennemsnitlig ledighed for 4.-7. kvartal) ifølge AAUs Økonomiafdeling. For alle relaterede uddannelser er den gennemsnitlige ledighed 4 % for 4.-7. kvartal i perioden 2013 til 2015.
Det er kendetegnende for alle beslægtede kandidatuddannelser, at ledighedsfrekvensen for årgangene 2013-2015 er lav allerede to kvartaler efter dimission (10-14 %). Ovenstående ledighedstal er endog meget lave, idet de tilsvarende frekvenser for naturvidenskabelige kandidatuddannelser (cand.scient.) generelt af UFM er opgjort til hhv. 25-29 % og for tekniske kandidatuddannelser (cand.polyt.) generelt til 23-26 %. Ledighedsfrekvenserne er desuden nærmere beskrevet i afsnittet ”Ledighedsfrekvensen for dimittender fra beslægtede uddannelser” i Dokumentation af efterspørgsel på uddannelsesprofil.
Den langsigtede ledighed forventes fortsat at være lav på beslægtede kandidatuddannelser. En prognose fra DI Digital[2] konkluderede i 2015, at it- og elektronikområdet i 2020 vil mangle 3.000 specialister på trods af fordobling i universiteternes optag af studerende. Rapport om kvalificeret arbejdskraft (2016)[3] udarbejdet af Danmarks Vækstråd fastslår, at der i 2030 vil mangle 19.000 it-specialister i Danmark.
På baggrund af den lave ledighedsfrekvens for beslægtede bacheloruddannelser og beslægtede kandidatuddannelser samt konklusionerne fra hhv. DI og Danmarks Vækstråd vurderer AAU således også dimittender fra både en bachelor- og en kandidatuddannelse i datavidenskab hurtigt vil komme i ansættelse og dermed ikke blive uddannet til ledighed.
Utilstrækkelig dækning af behovet fra eksisterende uddannelse
Danske virksomheder er på nuværende tidspunkt afhængige af at rekruttere dimittender fra forskellige ingeniør- og naturvidenskabelige uddannelser for at dække deres behov inden for datavidenskab. I Epinions behovsanalyse viser fremskrivninger, at de tættest beslægtede uddannelser sandsynligvis ikke kan dække det nuværende behov og slet ikke det fremtidige behov:
”Analyser og fremskrivninger for alle de nævnte uddannelser (red. Anvendt matematik, Softwareudvikling, Strategisk analyse og systemdesign og Matematik og teknologi) er helt klare: I de kommende år vil der være en udtalt risiko for en generel mangel på såvel ingeniørfaglige og naturvidenskabelige kandidater på det danske arbejdsmarked. Fremskrivninger foretaget af IDA og DA i 2011 og 2015 viser, at der potentielt er tale om en mangel på ca. 4000 naturvidenskabelige kandidater og mere end 9.000 ingeniører i 2025. Udviklingen skyldes en stadigt stigende efterspørgsel efter arbejdskraft med kompetencer inden for de to fagområder kombineret med et udbud, der ikke stiger i samme takt.
Efterspørgselspresset på f.eks. dataloger er allerede nu så kraftigt, at man stort set kunne fordoble optaget på kandidatniveau og stadig finde beskæftigelse på det danske arbejdsmarked. Mere specialiserede kandidater som de påtænkte kandidater i datavidenskab vurderes ud fra en overordnet vurdering også at kunne finde beskæftigelse.” (Bilag 1, s. 7)
Uddannelsens unikke karakter
Kandidatuddannelsen i datavidenskab giver en unik kombination af kompetencer fra flere fagområder: Dataopsamling, dataprocessering, datahåndtering, datamining, og maskinlæring fra det datalogiske område samt avanceret statistik fra det matematiske område. Derudover opnås der også kompetencer fra andre fagområder, f.eks. håndtering af sensordata og billedbehandling fra elektroniske systemer. I uddannelsen får den studerende også erfaringer med at arbejde med data fra mange forskelligartede anvendelsesområder, f.eks. trafik, sundhed og produktion. Denne kombination af kompetencer kan ikke opnås med de fagligt mest beslægtede danske kandidatuddannelser, som illustreret i nedenstående tabel 1, hvor 'X' markerer, at kompetencen opnås i tilstrækkelig dybde og omfang, og hvor '[X]' markerer, at kompetencen kun opnås i begrænset dybde og omfang. (Bemærk, at Epinion har analyseret et bredere spektrum af uddannelser og derfor også mindre beslægtede uddannelser i bilag 1.)
Tabel 1. Kompetencesammensammenligning med beslægtede kandidatuddannelser
|
Håndtering af og beregning med avancerede og komplekse datatyper |
Intelligent dataanalyse og maskin-læring |
Infrastruktur til Big Data |
Avanceret statistisk dataanalyse |
Dataanalyse i forretning, industri, ingeniør- og sundhedsvidenskab |
Denne nye uddan-nelse (AAU) |
X |
X |
X |
X |
X |
Datalogi (AAU, AU, KU, RUC, SDU) |
X |
[X] |
[X] |
|
[X] |
Software (AAU, DTU, ITU, SDU) |
X |
|
[X] |
|
|
Matematik (AAU, AU, KU, RUC, SDU) |
|
|
|
X |
|
Kompetencerne på kandidatuddannelsen i datavidenskab opnås vha. følgende moduler:
- Håndtering af og beregning med avancerede og komplekse datatyper
o Modulerne 1.1, 1.2, 2.2, 2.3, 2.5
- Intelligent dataanalyse og maskinlæring
o Modulerne 1.1, 1.3,1.5, 2.1, 2.4
- Infrastruktur til Big Data
o Modulerne 2.6, 3.1, 3.2
- Avanceret statistisk dataanalyse
o Modulerne 1.4, 3.3
- Dataanalyse i forretning, industri, ingeniør- og sundhedsvidenskab
o Modulerne 1.3, 2.3, 2.4, 2.6
De eksisterende datavidenskabsuddannelser i ind- og udland er enten på bachelor- eller kandidatniveau. Det er således svært for studerende at vælge forløb, der giver en sammenhængende og dyb faglig profil i datavidenskab. AAU vil lave en datavidenskabsuddannelse på både bachelor- og kandidatniveau, som er samdesignet for at opnå størst mulig sammenhæng og synergi i kompetenceprofilerne, og på den måde opnå en omfattende, dyb og tværfaglig profil for de færdiguddannede i datavidenskab. Epinions behovsanalyse viser, at større danske virksomheder fortrinsvist har behov for sådanne profiler og primært ansætter på kandidat- og ph.d.-niveau. Undersøgelsen viser dog også, at mindre danske virksomheder fortrinsvis har behov for bachelorer med datavidenskabskompetencer. ”Flere af de mindre virksomheder fremhæver især færdigheder og kompetencer fra bacheloruddannelsen som mest relevante for deres virksomhed. De hæfter sig ved, at kandidatuddannelsen har stort fokus på forskningsperspektivet. De oplever et større behov for praktisk viden. Dette skal ses i lyset af modenheden i virksomhederne, hvilket ofte hænger sammen med virksomhedernes størrelse. Større virksomheder har i højere grad ressourcer til at satse mere på arbejdet med store komplekse datamængder og decideret udvikling, hvilket kandidater har bedre forudsætninger for. […]
Større virksomheder, som i højere grad har mulighed for at investere i anvendelsen af
datavidenskab, orienterer sig primært efter medarbejdere på kandidatniveau og ph.d.-kandidater.” (bilag 1, s. 22).
Bacheloruddannelsen i datavidenskab er designet med en bred og praktisk vinkel, så den kan dække de mindre virksomheders behov samt være fødekanal til kandidatuddannelsen i datavidenskab. Der er således behov for både en bachelor- og kandidatuddannelse i datavidenskab.
For de relaterede AAU-uddannelser i Datalogi og Matematik er der meget lav ledighed for dimittender (hhv. 2,3 % og 2,5 % gennemsnitlig ledighed for 4.-7. kvartal). For alle relaterede uddannelser er den gennemsnitlige ledighed 4 % for 4.-7. kvartal i perioden 2013 til 2015. De meget lave ledighedsfrekvenser for de relaterede uddannelser peger desuden i retning af, at der er et behov for dimittender med kompetencer inden for datavidenskab.
Det årlige optag til uddannelsen vil være adgangsbegrænset til 60 studerende. Det forventes derfor, at der årligt uddannes 55-60 kandidater. På baggrund af antallet af stillingsopslag (se ovenfor) og Epinions behovsanalyse forventer vi, at det årlige danske behov for dimittender i datavidenskab fortsat vil være større end, hvad der uddannes fra de danske uddannelsesinstitutioner. Epinions behovsanalyse siger: "Den trendfremskrivning, som Epinion har foretaget baseret på nationale fremskrivninger og den gennemførte survey, viser, at efterspørgslen efter de datavidenskab-kandidater vil stige med ca. 30 % frem mod 2020 og ca. 40 % frem mod 2025. Oversættes denne tendens til de nye datavidenskab-kandidater vil der være en specifik mangel på mellem 200 og 500 datavidenskab-kandidater i 2020 og mellem 500 og 800 i 2025. Der er indregnet effekten af at man inden 2025 når at producere de første datavidenskab-kandidater på kandidatniveau."
Som dokumenteret af Epinion i bilag 1 vurderes det, at "virksomheder, som i dag har medarbejdere, der arbejder med analyse og håndtering af store/komplekse datamængder, angiver 86 %, at det vil være relevant at ansætte en data scientist fra Aalborg Universitet, og 40 % svarer at det i høj grad er tilfældet. 42 % af virksomheder uden denne type medarbejdere angiver, at det vil være relevant for dem at ansætte en data scientist fra Aalborg Universitet, og 4 % svarer at det i høj grad er tilfældet. 78 % af virksomhederne, som oplever et behov for medarbejdere med kompetencer inden for analyse og håndtering af store/komplekse datamængder, anser det som relevant at ansætte en data scientist fra Aalborg Universitet, og 31 % svarer at det i høj grad er tilfældet. Det samme gælder for 18 % af virksomheder, som har angivet, at de i dag ikke oplever et behov for den type medarbejdere, men efter at have set kompetenceprofilen alligevel ser et potentiale i en sådan medarbejder. 88 % af de adspurgte virksomheder i Region Sjælland anser kompetenceprofilen som relevant (25 % i høj grad), mens det samme gælder for 79 % i Region Syddanmark (31 % i høj grad), 74 % i Region Hovedstaden (33 % i høj grad), 71 % i Region Nordjylland (21 % i høj grad) og 53 % i Region Midtjylland (16 % i høj grad)." (bilag 1, s. 21). Epinion konkluderer endvidere: ”På regionalt plan opleves der størst behov i Hovedstaden (93 % og 63 % i høj grad) og Syddanmark (93 % og 34 % i høj grad), men der er også et stort behov i Region Sjælland (88 % og 50 % i høj grad), Nordjylland (86 % og 57 % i høj grad) og Midtjylland (75 % og 31 % i høj grad).” (bilag 1, s. 11)
Denne konklusion understreger, at der er et stort behov for uddannelser i datavidenskab i hele landet. Der findes allerede tilbud i Hovedstadsområdet, men efterspørgslen er langt større end kapaciteten. I den øvrige del af landet er der også et stort, udækket behov for dimittender i datavidenskab, og der er derfor behov for uddannelsestilbud i datavidenskab i Vestdanmark. Her er AAU en oplagt udbyder pga. de stærke faglige miljøer i datalogi og statistik og de store regionale behov i Nordjylland.
I Epinions dybdeinterview med aftagervirksomheder vurderes kompetenceprofilen for datavidenskabsuddannelsen fra Aalborg Universitet som interessant og relevant.
Mere generelt har Erhvervs- og vækstministeren offentliggjort Redegørelse for Danmarks Digitale Vækst 2016[1], i hvilken det nævnes, at "Danmark har en relativt lav andel af IT-specialister i den samlede beskæftigelse, og trods en forventet stigning skønnes der i 2030 at være en mangel på omkring 19.000 IT-specialister." Især "På en række af de nye vækstområder følger danske virksomheder som helhed ikke så godt med de bedste, eksempelvis i forhold til Internet of Things (kobling af fysiske genstande til internettet, fx i form af sensorer) og Big Data (analyse af egenproducerede og generelle datasæt med henblik på at optimere fx produktion, salg og lagerstyring mv.), hvor det også går hurtigere i de nordeuropæiske lande, vi normalt sammenligner os med."
AAU konkluderer således samlet set, at der er et stort og stærkt stigende, udækket behov for kandidater i datavidenskab, og at der derfor er behov for etablering af en kandidatuddannelse i datavidenskab på AAU.
Både det brede aftagerpanel for Skole for Informations- og Kommunikationsteknologi og den fagnære aftagergruppe for Studienævn for Datalogi har fået præsenteret uddannelsen og indgået i dialog om sammensætningen. Desuden har Epinion på foranledning af AAU gennemført en behovsanalyse vedr. en ny bachelor- og kandidatuddannelse i datavidenskab.
Aftagerpanelet for Skole for Informations- og Kommunikationsteknologi blev som nævnt inddraget 18. november 2016. Virksomhederne CEGO, Native Wired, Netcompany, DEIF, MapsPeople, BookBites, Danske Bank og Moment var repræsenterede på mødet, hvor motivationen bag uddannelsen blev præsenteret. Kommentarer fra den efterfølgende diskussion blev taget til efterretning og indgik i det videre arbejde (bilag 2).
Aftagergruppen for Studienævn for Datalogi blev inddraget 1. juni 2017. Virksomhederne CEGO, Native Wired, Netcompany, Danske Bank og Stofa/SydEnergi var repræsenterede på mødet, hvor udkast til studieordning blev præsenteret og diskuteret. Diskussionen gav ikke anledning til større ændringer. Der var bred opbakning fra alle til den foreslåede uddannelse (bilag 3).
Som tidligere nævnt har Epinion har i sommeren 2017 udarbejdet en analyse af behovet for dimittender i datavidenskab for AAU (bilag 1). Af analysen fremgår det, at 49 % af undersøgelsens virksomheder oplever i høj grad et behov for medarbejdere med kompetencer inden for datavidenskab, og 47 % forventer i høj grad at have dette behov i 2020. Andelen af virksomheder, som slet ikke har behov for medarbejdere med kompetencer inden for datavidenskab, er 12 %, og 13 % forventer ikke at have behov i 2020. En lidt større andel blandt store virksomheder med flere end 100 ansatte oplever et behov sammenlignet med virksomheder med under 100 ansatte.
Se desuden afsnittet ”Involvering af interessenter” i Dokumentation af efterspørgsel på uddannelsesprofil.
Uddannelsen i datavidenskab giver en unik blanding af kompetencer fra både datalogi og statistik. En dimittend i datavidenskab vil således være i stand til både at varetage datahåndtering af Big Data og lave meningsfulde statistiske analyser. Udviklingen af uddannelsen er sket på baggrund af diskussioner med aftagere samt undervisere/forskere primært fra Institut for Datalogi og Institut for Matematiske Fag, der leverer hovedparten af undervisningen med inddragelse af relevante fagområder som medialogi, elektronik, transport, energi, bio-tech og medicin. Som tidligere nævnt blev aftagergruppen for Studienævn for Datalogi (Bilag 3) inddraget i udviklingen af uddannelsen af flere omgange, i juni 2017 blev aftagergruppen inddraget i udviklingen af uddannelsen igen. Som et resultat af dialogen med aftagerne er bacheloruddannelsens sammensætning blevet tilpasset for at imødekomme ønsker og behov.
Desuden har resultater fra Epinions behovsanalyse givet anledning til mindre justeringer.
Specifikt i forhold til kompetenceprofilen for bacheloruddannelsen i datavidenskab fremhæver flere af de mindre virksomheder, at denne er særligt interessant for dem, da den i højere grad end kandidatuddannelsen har et fokus på praktisk viden samt praktiske færdigheder og kompetencer (bilag 1, s. 22). De større virksomheder, derimod, har en klar præference for kandidater i datavidenskab, som de anser for at have bedre forudsætninger for at arbejde med store og komplekse datamængder (bilag 1, s. 22-23). Epinions behovsanalyse viser desuden, at virksomheder over hele landet finder kompetenceprofilen for den foreslåede kandidatuddannelse i datavidenskab relevant (bilag 1, s. 21).
Desuden fastslår analysen fra Epinion, at kompetencer som ”Behandling af komplekse datasæt”, ”Statistik” og ”Analyse af komplekse datakilder” er behov, som virksomheder efterspørger nu og om tre år. Ligesom virksomhederne peger på kompetencer som ”Programmering”, ”Nye løsninger” samt ”Moderne software”, som vigtige kompetencer hos deres medarbejdere. Dette understreger i særdeleshed, at der på arbejdsmarkedet såvel i dag som i 2020 vil være et udtalt behov for dimittender i datavidenskab, idet der på kandidatuddannelsen er fokus på statistik, såvel analyse som behandling af komplekse datakilder, nye løsninger og moderne software. Dette er desuden udfoldet og illustreret i afsnittene ”Sammenhængen mellem uddannelsens kompetenceprofil og uddannelsens erhvervssigte” samt ”Det samfundsmæssige behov” i Dokumentation for efterspørgsel på uddannelsesprofil.
Uddannelsen henvender sig til bachelorer i datavidenskab fra AAU, som vil have retskrav denne kandidatuddannelse. Bachelorer i Data Science fra ITU vil have direkte adgang til kandidatuddannelsen. Kandidatuddannelse vil være den første kandidatuddannelse i datavidenskab i Danmark.
Kandidatuddannelsen i datavidenskab vil kunne udgøre grundlaget for ph.d.-indskrivning.
AAU har undervejs i udviklingen af uddannelsen gennemført en sammenlignende analyse med følgende eksisterende danske kandidatuddannelser udvalgt pga. deres faglige indhold:
- Datalogi (AAU, AU, KU, RUC, SDU)
- Software (AAU, DTU, ITU, SDU)
- Matematik (AAU, AU, KU, RUC, SDU)
- Matematik-økonomi (AAU, AU, KU, SDU)
Desuden udbyder AAU i regi af It-vest en masteruddannelse i softwarekonstruktion, hvor der er en fagpakke på 15 ECTS-point i Data Science og Big Data. Dette tilbud er et efter- videreuddannelsestilbud rettet mod erhvervsaktive bachelorer og kandidater.
De nærmest beslægtede uddannelser i Danmark er kandidatuddannelserne i datalogi, software og matematik. Københavns Universitet har et data science-spor på kandidatuddannelsen i datalogi.
Datavidenskabsuddannelsen på AAU adskiller sig fra disse uddannelser ved at have både et dybt og bredt fundament i dataprocessering/-håndtering og i statistik. Denne dybde og bredde understøttes af stærke faglige miljøer, der, i forbindelse med Forskningsevalueringen af Institut for Datalogi 2011-2015, af et internationalt evalueringspanel klassificeres som værende i verdensklasse. Yderligere er der i datavidenskab på AAU et bredere anvendelsesfokus, hvor flere datagenererende domæner inddrages.
Mere konkret vil den studerende på den foreslåede nye kandidatuddannelse i datavidenskab opnå omfattende viden, færdigheder og kompetencer inden for følgende fem internationalt anerkendte kernefagligheder for data science:
· Håndtering af og beregning med avancerede og komplekse datatyper
· Intelligent dataanalyse og maskinlæring
· Infrastruktur til Big Data
· Avanceret statistisk dataanalyse
· Dataanalyse i forretning, industri, ingeniør- og sundhedsvidenskab
Sammenligning med øvrige beslægtede uddannelser er yderligere udfoldet i Dokumentation af efterspørgsel på uddannelsesprofil, hvor det i afsnittet ”Det samfundsmæssige behov” er redegjort for øvrige uddannelser og herunder behovet for en ny kandidatuddannelse i datavidenskab.
Kandidater i datalogi, som er den nærmest beslægtede uddannelse, opnår alene omfattende viden, færdigheder og kompetencer inden for den første af disse kernefagligheder. Datalogikandidater opnår kun i begrænset omfang viden, færdigheder og kompetencer inden for "Intelligent dataanalyse og maskinlæring", "Infrastruktur til Big Data" og "Dataanalyse i forretning, industri, ingeniør- og sundhedsvidenskab", og inden for "Avanceret statistisk dataanalyse" opnår de ingen eller kun meget begrænset viden, færdigheder og kompetencer.
Den foreslåede nye kandidatuddannelse i datavidenskab på AAU vil således bidrage med en ny profil, som ikke i væsentligt omfang overlapper med kompetenceprofiler for eksisterende, beslægtede uddannelser eller med disses erhvervssigte.
Med den ansøgte uddannelse vil AAU være den eneste danske udbyder af en kandidatuddannelse i datavidenskab. Kandidatuddannelsen vil primært rekruttere bachelorer i datavidenskab fra AAU.
På denne kandidatuddannelse i datavidenskab er der en unik tværfaglighed, der forventes at tiltrække en anden gruppe af studerende end de klassiske datalogiske og matematiske uddannelser, herunder flere kvinder. På ITU's første optag til bacheloruddannelsen (ITU har ikke en kandidatuddannelse) i data science i 2017 var der 24 % kvindelige studerende, hvor andelen af kvinder på ITU's uddannelse i softwareudvikling var under 15%, mens den på både AAU's softwareingeniør- og datalogiuddannelser på bachelorniveau kun er ca. 7 %.
Det forventes, at der vil kunne optages 60 studerende årligt (dvs. op til det maksimale optagelsesantal). Der forventes, at størstedelen af dimittenderne fra AAU's bacheloruddannelse i datavidenskab vil søge ind på kandidatuddannelsen, som de har retskrav på. Desuden forventes der et mindre antal studerende fra andre uddannelsesinstitutioner.
Adgangsbegrænsningen på optaget på 60 studerende er ene og alene sat af hensyn til at sikre, at AAU kan tilbyde en uddannelse med de rette ressourcer og den bedste forskningsbaserede undervisning. Behovet for dimittender er dog større jf. Kriterium 1.
Såfremt nærværende prækvalifikation godkendes ventes første optag på uddannelsen i september 2022 (3 år efter første forventede optag på bacheloruddannelsen i datavidenskab, som der også ansøges om godkendelse til at oprette).
Kandidatuddannelsen i datavidenskab vil ikke indeholde obligatorisk praktik.