Bachelor - datavidenskab - Aarhus Universitet
Uddannelsen ønskes placeret under naturvidenskab, med følgende uddannelsesspecifikke adgangskrav:
- Samlet karaktergennemsnit på mindst 7 for den adgangsgivende uddannelse og Matematik A bestået med et gennemsnit på mindst 7.
- Ansøgere, der ikke opfylder disse krav, kan optages gennem en adgangsprøve.
Bacheloruddannelsen i datavidenskab kræver stærke, grundlæggende faglige kompetencer og en solid forståelse for og færdigheder i matematik, hvilket forventes opfyldt med de angivne adgangskrav.
Uddannelsens kernefaglige og konstituerende fagelementer er i overvejende grad naturvidenskabelige (140 ECTS af 150 ECTS), hvorfor uddannelsen ønskes placeret under naturvidenskab.
Adgang til kandidatuddannelser:Bacheloruddannelsen i datavidenskab giver direkte adgang til kandidatuddannelserne i Datavidenskab og til kandidatuddannelsen i Bioinformatik begge ved Aarhus Universitet (AU).
Retskrav: Med en bacheloruddannelse i datavidenskab vil man have retskrav på optagelse på kandidatuddannelse i datavidenskab på AU, der søges prækvalificeret samtidig med nærværende bacheloruddannelse.
Formålet med bacheloruddannelsen i datavidenskab er at uddanne dimittender med stærke kompetencer inden for avanceret dataanalyse og datahåndtering. Dimittenderne vil opnå kompetencer, der sætter dem i stand til at ekstrahere viden fra store datamængder (Big Data), analysere data og på baggrund heraf modellere relationer i datamængden. Uddannelsen udbydes som et samarbejde mellem fire institutter: Institut for Matematik, Institut for Datalogi, Institut for Ingeniørvidenskab og Institut for Økonomi og har således som grundlag en tværfaglig profil, der betyder at dimittender besidder den bredde af kompetencer, der kræves for at kompleksitet i dataanalyse og håndtering kan imødekommes.
Den tværfaglige profil i uddannelsen i datavidenskab er internationalt inspireret af f.eks. uddannelser i datavidenskab på Stanford (https://statistics.stanford.edu/academics/ms-statistics-data-science), Berkeley (https://datascience.berkeley.edu/) og NYU (http://datascience.nyu.edu/).
Der er i dag et stort udækket behov for personer med digitaliseringskompetencer, herunder personer der kan håndtere og analysere store datamængder. Regeringen præsenterede i maj 2016 rapporten ”Redegørelse om Danmarks Digitale Vækst 2016” (1) der beskriver regeringens ambition om at ruste Danmark til en digital fremtid. Relateret hertil kom rapporten ”Virksomheders behov for digitale kompetencer” (2), der kortlægger erhvervslivets efterspørgsel og de uddannelsesmæssige udbud på området. De to rapporter underbygger begge, at der er et meget stort behov for kompetenceopbygning på digitaliseringsområdet for at sikre Danmarks vækst.
De ansøgte bachelor- og kandidatuddannelser i datavidenskab skal ses som et indspil til samfundets generelle strategiske satsning på styrkelse af digitale kompetencer - med erhvervsminister Brian Mikkelsen ord: ”.... Danmark skal være en digital frontløber, som er blandt de hurtigste og dygtigste til at tage ny teknologi til os, og hvor vi samtidigt får alle danskere med...”.
En af de digitale avenuer, der vil kunne medvirke til at sikre en frontløberposition, er en effektiv og målrettet anvendelse af de kolossale mængder af data, der i dag indsamles men kun i begrænset omgang udnyttes. Typen af data varierer fra information om vejr og havstrømme, over information fra sundhedssektoren, til data fra de finansielle markeder eller om forbrugeradfærd. Og mængden af indsamlede data er kolossal. Dataopsamlingshastigheden i samfundet er i dag så stor, at der på to døgn produceres ligeså mange data, som der er blevet produceret fra starten af civilisationen til 2003. Og af de akkumulerede data estimeres, at man i dag har analyseret mindre end 3 %.
De computertekniske muligheder man har i dag åbner mulighed for, at man med de rette værktøjer og kompetencer vil kunne ekstraheres viden fra disse massive datapuljer langt mere effektivt end tilfældet er. En sådan viden vil kunne styrke erhvervslivets og samfundets mulighed for reelt at basere strategier og beslutninger på et solidt datagrundlag - og dermed være et vigtigt element i en datadrevet innovationsproces i virksomheder og samfund.
Aarhus Universitet vil med ansøgningerne om uddannelser inden for datavidenskab bidrage til produktion af personer, der besidder de kvalifikationer, som er en forudsætning for effektivt at kunne administrere og analysere store datamængder og gøre anvendelsen af den indlejrede viden tilgængelig og håndterbar for slutbrugerne. Hertil kræves personer med en interdisciplinær tilgang baseret på et solidt fagligt fundament inden for matematik, statistik, datateknologi og forretningsforståelse.
Bacheloruddannelsen i datavidenskab er en forskningsbaseret uddannelse med fokus på teoretiske, eksperimentelle og praktiske discipliner, der giver bacheloren grundlæggende kompetencer inden for sandsynlighedsteori, matematisk analyse og optimering, sandsynlighedsteori og statistik, inklusive metoder til organisering og analyse af store datamængder, samt metoder til anvendelse af data i modelbaserede fremskrivninger og scenarieanalyser.
Bacheloruddannelsen er fagligt struktureret omkring følgende overordnede vidensområder (for detaljeret kompetenceprofil se se upload: Dokumentationsbilag – prækvalifikationsansøgning):
- Statistik og sandsynlighedsteori
- Matematisk optimering og modellering
- Regression og kritisk analyse af datasæt
- Programmering og databaser
- Statistical Learning og Machine Learning
Dimittender i datavidenskab vil besidde en komplet pakke til håndtering og analyse af store datamængder og vil med deres tværfaglige tilgang udfylde et tomrum i det danske uddannelseslandskab. I dag varetages opgaver, der kræver disse kompetencer, af personer med en uddannelse inden for et område, hvor dataindsamling og dataanalyse indgår men ikke er et hovedfokus, som fx matematik, datalogi, fysik og økonomi. Disse dimittender er for nuværende henvist til at tilegne sig de specifikke kompetencer i forhold til håndtering af store datapuljer på mere autodidakt vis.
Uddannelsens dimittender vil, kombineret med en relevant kandidatuddannelse, dække et aftagermarked spændende fra banker og finansinstitutioner, over sundhedsvæsen og medicinalindustri til konsulent- og produktionsvirksomheder. Disse sektorer er alle karakteriseret ved at have, eller på vej til at få, behov for personer med kompetencer til at håndtere og udnytte store datapuljer.
Referencer til dette afsnit:
(1) Redegørelse for Danmarks digitale vækst 2016, Erhvervsstyrelsen, maj 2016.
(2) Virksomheders behov for digitale kompetencer, Erhvervsstyrelsen, maj 2016, s. 35.
Uddannelsens konstituerende elementer udgøres af 14 kurser på sammenlagt 150 ECTS:
- Introduktion til sandsynlighedsteori og statistik (10 ECTS)
- Introduktion til datavidenskab (10 ECTS)
- Matematisk analyse og konveks optimering (10 ECTS)
- Introduktion til programmering med videnskabelige anvendelser (10 ECTS)
- Numerisk lineær algebra (10 ECTS)
- Introduktion til matematisk statistik (10 ECTS)
- Causal inference (10 ECTS)
- Introduktion til statistical learning og machine learning (10 ECTS)
- Grundlæggende algoritmer og datastrukturer (10 ECTS)
- Databaser (10 ECTS)
- Modellering og optimizing decision problems (10 ECTS)
- Deep learning (10 ECTS)
- Videnskabsteori og etik (10 ECTS)
- Bachelorprojekt (20 ECTS)
I tilknytning til den konstituerende kerne vil der være et dataprojekt på 10 ECTS samt to valgfri elementer på hver 10 ECTS. Dataprojektet giver mulighed for under vejledning at benytte de teoretiske elementer på et virkeligt datasæt under vejledning af et tværfagligt team af undervisere på uddannelsen. De valgfri elementer vælges inden for et interdisciplinært spektrum af kurser, der bl.a. vil omfatte følgende:
- Statistical and machine learning in bioinformatics (10 ECTS)
- Computerarkitektur, Netværk og Operativsystemer (10 ECTS)
- Grafteori (10 ECTS)
- Mål- og integralteori (10 ECTS)
- Videregående sandsynlighedsteori (10 ECTS)
- Statistiske modeller (10 ECTS)
Et studiediagram for uddannelsens opbygning er givet i upload: Dokumentationsbilag – prækvalifikationsansøgning.
Beskrivelser af uddannelsens konstituerende faglige elementer:
Introduktion til sandsynlighedsteori og statistik: Introduktion til fundamentale egenskaber for stokastiske variable og et udvalg af standardfordelingerne samt statistiske tests. Programpakken R indgår til brug ved simulation. Kurset følges også af matematik/statistik studerende. Ved kursets afslutning forventes den studerende at kunne udføre sandsynlighedsberegninger på relevante stokastiske variable, beherske standardfordelinger og kunne anvende programpakken R til statistiske analyser af data.
Introduktion til datavidenskab: Perspektiverende/motiverende kursus som indgang til uddannelsen i datavidenskab. Introduktion til datavidenskabens elementer i form af 1) import af data, 2) rensning af data, 3) visualisering og modellering af data, 4) kommunikation af resultater ved inddragelse af programpakken R samt GitHub. Kurset omfatter en introduktion i første halvdel med projekter fra de tværfaglige aktører i sidste halvdel. Ved kursets afslutning forventes den studerende at kunne formulere og udføre mindre analyser af videnskabelige data under inddragelse af værktøjerne R og GitHub.
Matematisk analyse og konveks optimering: Introduktion til matematisk analyse med fokus på konvekse funktioner og konveks optimering. Kurset omfatter konvekse mængder, lineær optimering, introduktion til matematisk analyse, konvekse funktioner og ender med konveks optimering. Ved kursets afslutning forventes den studerende at kunne anvende centrale begreber fra indledende matematisk analyse samt anvende teorien for konvekse funktioner i optimering.
Introduktion til programmering med videnskabelige anvendelser: Introduktion til programmering med videnskabelige anvendelser i programmeringssproget python herunder introduktion af grundlæggende programmeringsbegreber. Videnskabelige anvendelser inddrages gennem programpakker i python. Ved kursets afslutning forventes den studerende at kunne forklare og benytte grundlæggende programmeringsbegreber og enkle algoritmiske teknikker samt anvende standardværktøjer til videnskabelige formål.
Introduktion til matematisk statistik: Analyse af data ved hjælp af klassiske parametriske metoder og inferens baseret på simulationer. Kurset følges også af matematik/statistik studerende. Programpakken R benyttes til analyse af data og stokastiske simulationer. Ved kursets afslutning forventes den studerende at kunne formulere og teste statistiske hypoteser, konstruere og implementere enkelte simulationseksperimenter og udlede estimatorer i simple tilfælde.
Numerisk lineær algebra: Et introducerende kursus i lineær algebra med fokus på anvendelser, numeriske metoder og praktiske algoritmer til løsning af lineære ligninger. Kurset kører sideløbende med programmeringskurset ovenfor og programmeringssproget python benyttes som platform. Ved kursets afslutning forventes den studerende at kunne anvende grundlæggende begreber i lineær algebra og relatere dem til stabile numeriske algoritmer i numerisk lineær algebra.
Causal inference: Med udgangspunkt i teorien erhvervet gennem forudgående kurser i sandsynlighedsteori og statistik i uddannelsen analyseres kausale spørgsmål baseret på observationer specielt i økonomisk kontekst. Ved kursets afslutning forventes den studerende at kunne identificere kausale spørgsmål, formulere kausale spørgsmål matematisk og estimere modeller ved maximum likelihood og udlede egenskaber af estimatorer og tests.
Introduktion til statistical og machine learning: Kurset indeholder fundementale læringsalgoritmer i machine learning herunder supervised learning techniques som grundlæggende klassifikation, træmodeller og support vector machines. Af unsupervised learning techniques berøres PCA, clusering og hierarchical clustering. Ved kursets afslutning forventes den studerende at kunne redegøre for og anvende fundamentale algoritmer i machine learning både for supervised og unsupervised learning.
Grundlæggende algoritmer og datastrukturer: Kurset introducerer grundlæggende datastrukturer som lister, stakke, køer og træer og algoritmer som korteste vej, divide-and-conquer samt dynamisk programmering i matematisk kontekst. Ved kursets afslutning forventes den studerende at kunne analysere og sammenligne tid og pladsforbrug af algoritmer, identificere gyldige invarianter for an algoritme samt formulere og udføre algoritmer og datastrukturer i pseudokode.
Databaser: Kurset indeholder den relationelle datamodel (inklusive data definition og constraints). Sprog og teknikker til design af relationelle databaser (Entity/Relationship modeller). Grundlæggende schema definitioner og forespørgsler i SQL sproget. Hyppige normalformer i relationelle databaser. Håndtering af samtidige transactioner og recovery. Forbindelse mellem programmer og databaser. Basal sikkerhed og adgangsbegrænsninger. Ved kursets afslutning forventes den studerende at kunne beskrive den relationelle model samt programmere basale applikationer baseret på relationsdatabaser i SQL.
Modellering og optimizing decision problems: Kurset omhandler optimeringsproblemer, som kan modelleres i matematiske modeller med beslutningsvariable. Algoritmerne til løsning eller approksimation af disse optimeringsproblemer berøres, herunder heuristikker, heltalsoptimering, simulation og Markov beslutningsprocesser. Der lægges vægt på hands-on experience gennem datasæt og øvelser under brug af optimeringssoftware. Ved kursets afslutning forventes den studerende at kunne opstille optimeringsmodeller og anvende kursets algoritmer på praktiske problemer under inddragelse af optimeringssoftware.
Deep learning: Kurset omhandler centrale emner i uddannelsen: Den grundlæggende teori for neurale netværk og deres træning under inddragelse af praktiske problemer som f.eks. tale- og billedgenkendelse. Forskellige type af netværk berøres, herunder convolutional neural networks og recurrent neural networks. Specielt vil kurset introducere reinforcement learning i kombination med deep neural networks i beslutningsprocesser. Ved kursets afslutning forventes den studerende at kunne anvende teknikker for design og træning af deep neural networks i realistiske problemstillinger.
Videnskabsteori og etik: Videnskabsteori i kontekst af datavidenskab med problemstillinger fra machine learning og kunstig intelligens samt problemstillinger relateret til indsamling og anvendelse af data fra store puljer af data, der opbygges på basis af individers adfærd fx. kørselsmønstre, telefoni, datatransport eller andet. Ved kursets afslutning forventes den studerende at kunne reflektere kritisk over datavidenskabens rolle og ansvar i forhold til forskning, erhverv, samfund og kultur.
Progressionsmæssigt er uddannelsen opbygget, så de studerende på første studieår opnår grundlæggende teoretisk viden inden for uddannelsens grundelementer. For matematik drejer det sig om grundlæggende statistik, matematisk analyse samt algebra og for datateknologi om grundlæggende programmering og basal dataforvaltning.
På andet studieår konsolideres interaktionen mellem uddannelsens grundlæggende discipliner i mere tværdisciplinære kurser og andre studieaktiviteter. Samtidig styrkes de studerendes kompetencer inden for avancerede algoritmer, machine learning og statistical learning. Herudover udbygges viden om databaser, databasehåndtering, dataforvaltning samt forståelsen for datastrukturer. Dataprojektet, der afslutter andet studieår, vil være case-baseret og træne den studerende i konkret anvendelse af den opnåede viden på et virkeligt datasæt og vil parallelt træne de mere forretningsmæssige elementer. Et eksempel på et case-orienteret projekt kunne være analyse, forudsigelse og modellering af ekstreme vejrfænomener, som fx. kan have praktisk anvendelse ved dimensionering af kloaksystemer, ved risikovurdering i forhold til forsikring eller ved forudsigelser af nødvendigt ressourceberedskab. Andre eksempler kunne være analyse og modellering af finansmarkedets bevægelser med henblik på at styrke forudsigelser i forbindelse med højfrekvent handel, analyse af sundhedsdata eller genomdata. Projekterne vil inddrage aftagervirksomheder, der skal sikre autenticitet i projekterne og medvirke til at forberede de studerende på arbejdsmarkedet.
På tredje år har den studerende mulighed for tilvalg, som kan anvendes til styrkelse af særlige interesseområder (fx avanceret statistik, bioinformatik eller lignende) eller styrkelse af domænekendskabet til de fagområder der er genstandsfelt for de datavidenskabelige analyser (fx molekylærbiologi, økonomi, meteorologi). Tredje studieår afsluttes med bachelorprojekt, hvor det primære fokus vil være på anvendelse af de opnåede kompetencer på en virkelig problemstilling, der kan afdække de udfordringer datavidenskaben kan medvirke til at løse, og samtidig demonstrere den studerendes evne til at anvende eksisterende analytiske tilgange. Bachelorprojekterne vil som udgangspunkt blive gennemført i samarbejde med erhvervslivet.
Datavidenskab ønskes placeret under det naturvidenskabelige område og foreslås indplaceret på takst 3, svarende til den indplacering der er godkendt for IT-Universitets bacheloruddannelse i Data Science.
Den hastige digitale udvikling forårsager radikale samfundsmæssige ændringer og har foranlediget globale ”megatrends” som ”disruption” og ”Industri 4.0”. Denne udvikling stiller store krav til uddannelse af flere dimittender og målrettet kompetenceudvikling indenfor digitaliseringsområdet. Ikke mindst i det private erhvervsliv er man bevidst herom, og der udtrykkes herfra et meget stort behov for specialiseret og højtuddannet arbejdskraft. Det eksisterende uddannelsesudbud imødekommer kun i begrænset omfang den aktuelle og forventede efterspørgsel på højtuddannet arbejdskraft med digitale kompetencer, herunder kapaciteten til at kunne systematisere det ’at lære fra data’, hvilket kræver personer med dybe, tværfaglige kompetencer inden for området.
Aarhus Universitets nye uddannelse i datavidenskab er udviklet med henblik på at dække dette specifikke, kvalitative behov på det danske arbejdsmarked. Uddannelsen vil herudover medvirke til at dække det store kvantitative behov for personer med digitaliseringskompetencer, da den forventes at kunne tiltrække et nyt segment af studerende med stor interesse og evner for matematik i anvendt sammenhæng snarere end som en ren disciplin.
OECD 2014 (1) vurderer, at digitaliseringsteknologier til behandling af store datamængder og datadrevet innovation i de seneste 5 år har haft en vækst på 40 % om året, med en estimeret markedsværdi på 17 mia. USD i 2015, og det har forøget produktiviteten for virksomheder, som bruger teknologierne, med 5-10 %. I Berlingske Toplederpanel viser en undersøgelse fra april 2016, at implementering af nye datateknologier er den højeste prioritet for 47 % af de adspurgte ledere. Ifølge nyere rapporter (2,3) forventer halvdelen af lederne, at den nuværende kerneforretning i deres virksomheder vil ændre sig væsentligt, eller helt forsvinde, inden for de næste 3 til 5 år, og den vigtigste årsag er digitalisering. Topledernes største bekymring er manglen på kvalificeret arbejdskraft. Denne bekymring deles af 62 % af dem. Behovet for digitaliseringsspecialister, hvilket inkluderer bachelorer i datavidenskab, er således enormt og veldokumenteret.
I en kortlægning af virksomheders behov for digitale kompetencer, som blev lavet til Erhvervsstyrelsen i 2016 (5), skønnes det, at der i 2030 vil være en mangel på omkring 19.000 IT-specialister. Et øget optag på digitale og tekniske uddannelser er også en af anbefalingerne fra Danmarks Digitale Vækstpanel (6) som blev afleveret til regeringen i maj 2017. Behovet for IT-specialister er også fremhævet i Erhvervsministeriets redegørelse om Danmarks digitale vækst 2017 (7), hvor det fremhæves selvom danske virksomheder generelt er langt fremme med digitalisering klarer vi os dårligt på flere af de nyere vækstområder som fx analyse af kundedata, Big Data, og Internet of Things. I den sammenhæng henvises der endvidere til OECD’s analyser af hvorledes datadreven innovation og forretningsudvikling kan føre til produktivitetsforbedringer og det slås fast (side 22), at ”På sigt kan den relativt lave dataanvendelse, blive en konkurrencemæssig udfordring for Danmark".
Potentialerne i udnyttelsen af data analyse (Big Data) fremhæves i flere andre rapporter og analyser fra forskellige aktører. Eksempelvis angav Danmarks Vækstråd således som en anbefaling i 2015 eksplicit, at der skal uddannes flere data-analytikere (8). Rambøll har efter opdrag fra ITU, som har fået godkendt en bacheloruddannelse i Data Science i 2016, gennemført en analyse (9), som også klart konkluderer, at der nationalt såvel som internationalt er stor og voksende efterspørgsel på ”data scientists”.
Den ansøgte uddannelse i datavidenskab på AU har ligheder med den nye uddannelse på ITU, men adskiller sig ved at bibringe den studerende et stærkere matematisk-analytisk grundlag. Derudover er den tværdisciplinær og rækker ud mod områder som ingeniørvidenskab, statistik og økonomi, hvor data analyse er højrelevant. Uddannelsens specielle profil er nærmere uddybet i afsnittet ”Sammenhæng i uddannelsessystemet”.
Arbejdet med planlægning og tilrettelæggelse af uddannelsen i datavidenskab ved Aarhus Universitet har bekræftet erhvervslivets stærke interesse i og behov for dimittender i datavidenskab. Uddannelsen blev indledningsvis diskuteret med Aarhus Universitets aftagerpanel for matematik, matematik-økonomi og statistik. Her fik forslaget positiv støtte og der blev udtrykt en klar bekræftelse af behovet. Universitetet blev derfor opfordret til at gå videre med initiativet. Efterfølgende har der i udviklingsprocessen været en tæt dialog med erhvervslivet, der gennem hele forløbet har bekræftet behovet for dimittender inden for datavidenskab. Dette er der redgjort nærmere for i afsnittet ”Hvordan er det sikret at den nye uddannelse matcher det påviste behov”.
Som opfølgning på kontakten med potentielle aftagere i forbindelse med opbygning af uddannelsen har Aarhus Universitet gennem konsulentfirmaet HC Ralking gennemført en supplerende kvalitativ og kvantitativ analyse af behovet for dimittender i datavidenskab. Rapporten er indeholdt i upload: Dokumentationsbilag – prækvalifikationsansøgning. Hovedkonklusionen af undersøgelsen er:
Behovsafdækningen involverede en interviewundersøgelse hvor i repræsentanter fra 27 virksomheder deltog. Interviews er gennemført i august – september 2017. Virksomhederne blev spurgt om, hvor mange af deres ansatte med kandidateksamen eller højere, der er beskæftiget med dataanalyse. Virksomhedernes oplyste her at et antal på 1347-1569 medarbejdere er beskæftiget med dataanalyse.
Virksomhedernes svar bekræftede endvidere, at de generelt har svært ved at skaffe arbejdskraft med de rigtige kompetencer og at de derfor prøver at klare sig med, hvad de kan få. De hyppigst foretrukne profiler er fysikere, matematikere, dataloger og ingeniører. Virksomhederne rapporterer endvidere om kraftige vækstrater. En del virksomheder regner med en årlig vækst i antal ansatte på mindst 20% på dette område. Virksomhedernes samlede estimat for behovet inden for fagområdet dataanalyse over de næste 5 år ligger på mindst 600.
"I Danmark er ca. 10 – 20 ud af ca. 500 ansatte hard core i data analytics. Vi har enormt svært ved at ansætte folk med disse kompetencer. Vi kan ikke få dem. Vi flyver dem ind fra andre lande, mange fra Riga. Der er et kæmpe gap! Der er alt for få uddannet til dette. Ca. 100 – 150 arbejder med dette i Accenture i Danmark. De fleste er altså fløjet ind."
--- Kim Bech, Managing director, Accenture Digital Denmark.
I forhold til uddannelsesprofilen for datavidenskab udtrykker samtlige virksomheder sig i positive vendinger. Flere betegner det som ’Spot on’ og ’Lige det, vi har brug for’. Direkte adspurgt hvorledes Datavidenskab vil passe ind i virksomhedens planer for fremtiden tilkendegiver alle virksomheder at dimittender i datavidenskab vil passe fint med virksomhedens planer og vil udfylde et p.t. udækket behov. Virksomhederne mangler akut kompetencer inden for datavidenskab:
"Lige nøjagtigt ’Data Science’ har vi brug for. En række jobs er ’skåret til’, fordi vi ikke kan finde folk med de rette kompetencer."
--- Thomas Asger Hansen, Head of Big Data & IoT Lab, Grundfos.
Hovedparten af virksomhederne udtrykker endvidere at de gerne indgår i et tæt samarbejde med Aarhus Universitet med henblik på at bibringe dimittender i Datavidenskab en praktisk og virksomhedsnær forståelse under studiet.
Behov for arbejdskraft vil ofte afspejles gennem en lav ledighed blandt dimittender med den efterspurgte kompetence. Der er i Danmark endnu ikke uddannet bachelorer eller kandidater inden for datavidenskab, hvorfor der ikke forefindes specifikke ledighedsestimater. Kandidater fra uddannelserne i matematik, matematik-økonomi, datalogi og fysik har alle en meget lav ledighed og det er de kandidater, der i dag i erhvervslivet bestrider jobfunktioner relateret til håndtering af store datamængder, hvor kompetenceprofilen fra datavidenskab vil være et bedre match. Kandidater i datalogi havde i perioden 2009-2013 en ledighed på 2,8-4,9 % (opgjort 4-7 kvartal efter fuldførelsesdato) mens den tilsvarende ledighed for kandidater i matematik og matematik-økonomi svingede mellem 0,9-3,8 %. Til sammenligning lå landsgennemsnittet i samme periode på 9.5-11,6% (tal for aktuel ledighed hentet fra http://ufm.dk/uddannelse-og-institutioner/statistik-og-analyser/faerdiguddannede/aktuel-ledighed). Den lave ledighed blandt disse kandidater, kombineret med det udtrykte stærkt voksende behov for digitaliseringsekspertise generelt, betyder også, at der ikke forventes en stigende arbejdsløshed inden for disse uddannelser, som et resultat af produktion af kandidater i datavidenskab.
Referencer til dette afsnit:
(1) OECD (2014), Data-driven Innovation for Growth and Well-being.
(2) Topchefer: Kerneforretningen vil dø om tre til fem år. Berlingske toplederpanel, onsdag d. 27. april 2016.
(3) Redegørelse for Danmarks digitale vækst 2016, Erhvervsstyrelsen, maj 2016.
(4) A future that works, McKinsey & Company og Aarhus Universitet, maj 2017.
(5) Højbjerre, Brauer og Schultz. Virksomheders behov for digitale kompetencer, Erhvervsstyrelsen, maj 2016.
(6) Danmark som digital frontløber – anbefalinger til regeringen fra Digitalt Vækstpanel, 2017.
(7) Redegørelse om Danmarks digitale vækst 2017. Erhvervsministeriet, side 6.
(8) Danmarks Vækstråd, Anbefalinger vedr. datadreven udvikling og vækst, 2015
(9) Markedsundersøgelse for Data Science. Rambøll og IT-Universitetet i København, maj 2016, side 4.
I forbindelse med udviklingen af de nye bachelor- og kandidatuddannelser i datavidenskab har Aarhus Universitet gennemført en kvantitativ undersøgelse af behovet for uddannelsen hos en række virksomheder. Undersøgelsen ar baseret på interviews med relevante virksomhedsrepræsentanter omkring virksomhedens behov for dimittender inden for datavidenskab.
De 27 virksomheder, som indgik i behovsafdækningens interviewundersøgelse, udtrykte et samlet estimat for behovet inden for fagområdet dataanalyse over de næste 5 år på mindst 600 dimittender, i det omfang de kan skaffes.
Aarhus Universitet planlægger i første omgang at optage 30 studerende på bacheloruddannelsen, med en ambition om at øge antallet til 60 henover de følgende år. Bachelorerne vil besidde kvalifikationer, der efterspørges på arbejdsmarkedet. For eksempel udtrykker virksomheden EPINION i behovsundersøgelsen, at lige nøjagtigt ’Data Science’ har man brug for, og generelt vil man gerne have bachelorer og selv uddanne dem resten af vejen. Størstedelen af bachelorerne forventes dog at fortsætte på kandidatuddannelsen i datavidenskab, eller på en anden relevant kandidatuddannelse, hvilket vil gøre dem endnu mere attraktive på arbejdsmarkedet. Ansøgning om godkendelse af oprettelsen af en kandidatuddannelse i datavidenskab er indsendt parallelt med denne ansøgning.
Samlet er forventningen, at der vil blive produceret omkring 25 dimittender til arbejdsmarkedet fra første optagelsesårgang, stigende til 50 dimittender om året ved fuld indfasning. Givet den aktuelle store efterspørgsel på kompetencer inden for datavidenskab forventes det ikke, at arbejdsmarkedet vil have problemer med at absorbere denne produktion. Også set i lyset af, at det forventes de fleste vil fortsætte på en kandidatuddannelse.
Indledningsvist blev der taget en dialog med aftagerpanelet for matematik, matematik-økonomi og statistik ved Aarhus Universitet bestående af:
Anne Lund Christophersen (formand), Vestas, Tue Rauff Lind Christensen, TDC, Søren Dahlgaard, Nordea Bank Danmark A/S, Dinna Balling, Viby Gymnasium, Maja Tarp, Novo, Søren Have, Rambøll, Lasse Broby Rieks, Aarhus Katedralskole.
Den efterfølgende proces har involveret 27 virksomheder. Disse blev udvalgt sådan at de dels dækker alle relevante anvendelsesområder for datavidenskab, dels repræsenterer såvel det nationale som det lokale erhvervsliv og inkluderer virksomheder af forskellig størrelse samt inkludere både private og offentlige aftagere. En samlet liste over involverede virksomheder findes i upload: Dokumentationsbilag – prækvalifikationsansøgning.
Samarbejdet med den aftagergruppe, der har været involveret i opbygningen af uddannelsen, forventes at forsætte, hvis uddannelsen godkendes. Der vil jfr. Universitetsloven blive etableret et aftagerpanel for uddannelsen bestående af repræsentanter fra de virksomheder, der har været mest aktive i udviklingsprocessen. Virksomhederne vil også blive inddraget aktivt i undervisningen, hvilket der generelt er udtrykt stor interesse for i behovsundersøgelsen. Dette vil ske gennem deltagelse som gæsteforelæsere og gennem bidrag med realistiske data cases, som de studerende kan arbejde med i deres projekter. Virksomhedsrepræsentanter vil også blive inddraget som eksterne medvejledere i forbindelse med projekter der gennemføres sammen med aftagere.
Design, kompetenceprofil og curriculum sammensætning for uddannelsen er et resultat af en iterativ proces mellem de involverede institutter og aftagere. En proces der har haft til formål at sikre, at uddannelsen har relevans for arbejdsmarkedet og at uddannelsens dimittender kan imødekomme de krav og behov virksomhederne har for kompetencer inden for datavidenskab.
Som nævnt ovenfor blev oplægget til uddannelsen indledningsvis diskuteret med aftagerpanelet for matematik, matematik-økonomi og statistik. Efterfølgende blev der taget kontakt til og afholdt møder omkring uddannelsen med Region Midt, ITForum, Epinion, Kapacity og LandIT, der alle tilkendegav deres støtte til initiativet og udtrykte forventning om stort behov for dimittenderne grundet det hastigt voksende forretningsmæssige potentiale i området.
Efterfølgende har institutleder for Matematisk Institut, Niels Ovesen Nygaard, sammen med instituttets erhvervskonsulent deltaget i en række industrikonferencer, hvor den faglige baggrund, indhold og rammer for uddannelsen er blevet fremlagt og positivt modtaget. Primo maj blev der afholdt en workshop med deltagelse af centrale medarbejdere fra Energinet, Enversion, Epinion, Grundfos, ITMINDS, Kapacity, Niras, Rambøll, Solitworks, Stibo-Accelarators, Uber og Vestas (se nærmere beskrivelse i upload: Dokumentationsbilag – prækvalifikationsansøgning). Fokus for workshoppen var, at få afklaret om kompetenceprofilen for datavidenskab matchede virksomhedernes behov, og om dimittender med anden baggrund eventuelt kunne dække området. Disse virksomheder er alle karakteriseret ved i dag at arbejde med analyse af og anvendelse af information fra store datamængder, opgaver der p.t. løses i dag af kandidater med baggrund i matematik, matematik-økonomi, statistik, datalogi/it, fysik og business intelligence. Virksomhederne pegede entydigt på, at behovet for kompetencer inden for feltet ikke er imødekommet hermed. Der er et uopfyldt behov for dimittender med dybe, tværgående kompetencer, der kan arbejde på tværs af disciplinerne, svarende til kompetenceprofilen for datavidenskab.
Ud over støtte til uddannelsen og ønske om at kunne ansætte personer med disse kompetencer, har virksomhederne bredt tilkendegivet, at de gerne deltager mere praktisk i uddannelsen. Det kunne være gennem gæstedeltagelse i undervisning, deltagelse i projektorienterede forløb (herunder bachelorprojekter og på kandidatuddannelsen også specialer), gennem tilvejebringelse af konkrete cases og tilhørende datasæt, karrierearrangementer, deltagelse i mentorordninger eller som medlemmer af aftagerpaneler.
Den ansøgte bacheloruddannelse i datavidenskab er sammen med bacheloruddannelsen i Data Science ved IT-Universitet (ITU), der havde sit første optag i efteråret 2017, de eneste uddannelser inden for området i Danmark. Bacheloruddannelsen i datavidenskab er den første, der vil blive udbudt i Vestdanmark.
Datavidenskab på AU er opbygget i samarbejde med erhvervslivet med inspiration fra lignende uddannelser på de større universiteter i USA. Den er forankret i en tværfaglighed med basis i et omfattende teoretisk fundament i matematik, statistik og datalogi og adskiller sig på væsentlige punkter fra uddannelsen i Data Science ved IT-Universitet (ITU). De konstituerende faglige elementer på Data Science ved ITU udgør 150 ECTS med hovedvægt på datalogi. Således har 127,5 ECTS kurser og projektelementer på uddannelsen et programmeringsindhold mens 75 ECTS kurser angives at have et matematisk indhold (et kursus kan i denne klassifikation have både programmeringsindhold og matematisk indhold). Kun 7,5 ECTS i form af kurset "Linear algebra and optimisation" har rent matematisk karakter. Det er p.t. kun muligt at se kursusbeskrivelserne for kurserne på første semester af uddannelsen i ITUs kursuskatalog. Oversigten er derfor baseret på angivelserne i kursusplanen i ITUs ansøgningsbilag (side 2).
I modsætning hertil indeholder bacheloruddannelsen i datavidenskab ved AU 70 ECTS kurser af primært matematisk-analytisk karakter. Heraf falder 40 ECTS indenfor området statistik og sandsynlighedsregning, sammenlignet med 7,5 ECTS på uddannelsen i Data Science ved ITU. En anden central komponent i uddannelsen i datavidenskab ved AU er de to 10 ECTS kurser i "numerisk lineær algebra" og "Matematisk analyse og konveks optimering" der kan sammenlignes med 7,5 ECTS kurset "Linear algebra and optimisation" på uddannelsen i Data Science. Disse forskelle i profilen illustrerer den stærke matematiske teoretiske forankring af bacheloruddannelsen i datavidenskab ved AU sammenlignet med Data Science ved ITU. Omfanget af datalogiske grundkurser i de to uddannelser er derimod sammenligneligt. Begge uddannelser har kurser i "Algoritmer og datastrukturer" (10 ECTS på datavidenskab, 7,5 ECTS på Data Science). Datavidenskab ved AU har et 10 ECTS kursus i "Databaser", mens Data Science har et 7,5 ECTS kursus i "Network Analysis". I det centrale emne Machine Learning har Data Science et 15 ECTS kursus på 3. semester, mens datavidenskab ved AU har et 20 ECTS forløb fordelt over 3. og 5. semester - på 3. semester gives et 10 ECTS kursus i "Statistical Learning" i forlængelse af de statistiske grundkurser på førsteåret og i 5. semester følges dette op af 10 ECTS kurset "Deep Learning" som bl.a. omhandler neurale netværk.
Sammenfattende kan det siges at uddannelsen i datavidenskab på AU har en stærk forankring i en tværfaglighed mellem science uddannelserne baseret på et stærkt teoretisk fundament i matematik, statistik og datalogi. Bacheloruddannelsen i data science ved ITU er derimod rettet mod en bredere vifte af specielt datalogiske kompetencer i databehandling.
Udover ITUs bacheloruddannelse i Data Science udbydes der i Danmark en række bacheloruddannelser hvor centrale delelementer af det curriculum, der kendetegner datavidenskab, er repræsenteret. Overordnet kan disse kategoriseres inden for områderne matematik, anvendt matematik, matematik-økonomi, datalogi og ingeniørtekniske uddannelser. Ingen er dog direkte sammenlignelige med den ansøgte bacheloruddannelse i datavidenskab eller ITUs bacheloruddannelse i Data Science. En detaljeret gennemgang af disse uddannelser i forhold til den ansøgte bacheloruddannelse i datavidenskab er givet i upload: Dokumentationsbilag – prækvalifikationsansøgning. Samlet drejer det sig om følgende bacheloruddannelser:
1. Matematik:
Bacheloruddannelse i matematik, Aarhus Universitet Bacheloruddannelse i matematik, Københavns Universitet Bacheloruddannelse i matematik, Syddansk Universitet Bacheloruddannelse i matematik, Roskilde Universitet Bacheloruddannelse i matematik, Aalborg Universitet
2. Anvendt matematik:
Bacheloruddannelse i anvendt matematik, Syddansk Universitet Bacheloruddannelse i forsikringsmatematik, Københavns Universitet
3. Matematik-økonomi:
Bacheloruddannelse i matematik-økonomi, Aarhus Universitet Bacheloruddannelse i matematik-økonomi, Københavns Universitet Bacheloruddannelse i matematik-økonomi, Syddansk Universitet
4. Datalogi:
Bacheloruddannelse i datalogi, Aarhus Universitet
Bacheloruddannelse i datalogi, Københavns Universitet Bacheloruddannelse i datalogi, Syddansk Universitet Bacheloruddannelse i datalogi, Roskilde Universitet Bacheloruddannelse i datalogi, Aalborg Universitet Bacheloruddannelsen i IT, Aarhus Universitet
5. Ingeniørtekniske uddannelser:
Bachelor i strategisk analyse og systemdesign, Danmarks Tekniske Universitet
Kandidater fra uddannelserne i matematik, matematik-økonomi, datalogi, der i forhold til datavidenskab er de mest beslægtede uddannelser, har alle en lav ledighed 0,9 % - 4,9 % for perioden 2009-2013 (opgjort 4-7 kvartal efter fuldførelsesdato, data fra Uddannelses- og Forskningsministeriet, http://ufm.dk/uddannelse-og-institutioner/statistik-og-analyser/faerdiguddannede/aktuel-ledighed). For naturvidenskabelige uddannelser generel var ledigheden i periode 11,5 % - 13,5 %.
Uddannelsens målgruppe er studerende fra alle gymnasiale retninger (stx, htx, hhx, hf og internationale skoler), der kan imødekomme de uddannelses- og områdespecifikke adgangskrav som angivet i afsnittet ”Hvilke adgangskrav er gældende for uddannelsen”.
Uddannelsen er tilrettelagt med henblik på at tiltrække studerende med en kombineret interesse for datalogi, matematisk analyse og en anvendelsesorienteret udnyttelse af data. Med sin vinkling på tværfaglighed i et anvendelsesorienteret perspektiv forventes uddannelsen at kunne rekruttere en gruppe af studerende, der i dag ikke tiltrækkes af de naturvidenskabelige og tekniske uddannelser. Det forventes derfor ikke at udbuddet af datavidenskab vil påvirke rekrutteringen til andre STEM uddannelser i væsentlig grad.
Det skal her noteres at interessen for uddannelser inden for det matematiske-datalogiske område ved AU har været pænt stigende over de seneste år, med en forøgelse på 20 % for 1. prioritetsansøgere og 30 % for samlede antal ansøgere i perioden 2012-2017. For de matematiske uddannelser har der endvidere været et stigende antal kvindelige ansøgere. Denne interesse forventer vi at kunne overføre på datavidenskab.
Der forventes at blive optaget 30 studerende på uddannelsen i opstartsåret, voksende til 60 i løbet af en periode på 3-4 år.
Ikke relevant.