Ansøgning om prækvalifikation af videregående uddannelser

Kandidat - datavidenskab - Aarhus Universitet

Aarhus Universitet
02/10-2017 09:32
2017-2
Godkendt
Ansøgningstype
Ny uddannelse

Udbudssted
Aarhus

Kontaktperson for ansøgningen på uddannelsesinstitutionen
Astrid Gad Knudsen, agk@au.dk

Er institutionen institutionsakkrediteret?
Betinget

Er der tidligere søgt om godkendelse af uddannelsen eller udbuddet?
Nej

Uddannelsestype
Kandidat

Uddannelsens fagbetegnelse på dansk fx. kemi
datavidenskab

Uddannelsens fagbetegnelse på engelsk fx. chemistry
Data Science

Den uddannedes titel på dansk
Cand.scient i datavidenskab

Den uddannedes titel på engelsk
Master of Science(MSc) in Data Science

Hvilket hovedområde hører uddannelsen under?
Naturvidenskab

Hvilke adgangskrav gælder til uddannelsen?

Optagelse på kandidatuddannelsen i datavidenskab kan ske på baggrund af en gennemført bacheloruddannelse i datavidenskab fra Aarhus Universitet (retskrav).


Tilsvarende vil bachelorer i matematik og matematik-økonomi kunne optages, dog afhængigt af tilvalg.


Herudover kan bacheloruddannelser med et væsentligt indhold (> 90 ECTS) af fagelementer inden for datavidenskab give adgang efter individuel vurdering. Kravet om > 90 ECTS indenfor datavidenskab, dvs. matematisk analyse, statistik, sandsynlighedsteori, machine learning, programmering og metoder til organisering og anvendelse af store datamængder, skal sikre, at den studerende har de forudsætninger, der på kandidatniveauet er nødvendige for kunne opnå den ønskede faglige højde inden for centrale datavidenskabselementer.


Da uddannelsen udbydes på engelsk kræves engelskkundskaber svarende til det gymnasiale B-niveau.


Er det et internationalt uddannelsessamarbejde?
Nej

Hvis ja, hvilket samarbejde?

Hvilket sprog udbydes uddannelsen på?
Engelsk

Er uddannelsen primært baseret på e-læring?
Nej

ECTS-omfang
120

Beskrivelse af uddannelsen

Formålet med den ansøgte kandidatuddannelse i datavidenskab er, at uddanne dimittender med stærke kompetencer inden for avanceret dataanalyse og datahåndtering. Dimittenderne vil på en faglig platform med fokus på matematik og datalogi opnå kompetencer, der sætter den i stand til at ekstrahere viden fra store datamængder (Big Data), herunder kunne analysere data og på bagrund heraf modellere relationer i datamængden – kompetencer som der fremadrettet vil være et meget stort behov for på arbejdsmarkedet. Uddannelsen udbydes i et samarbejde mellem fire institutter på Aarhus Universitet: Institut for Matematik, Institut for Datalogi, Institut for Ingeniørvidenskab og Institut for Økonomi. Den giver kandidaterne kompetencer til at arbejde tværfagligt baseret på en dybdegående viden om alle de essentielle områder inden for datavidenskab. De studerende vil under uddannelsen naturligt indgå i projekter, der omhandler løsninger af problemer, som ikke kommer fra datavidenskab, men hvor datavidenskabelige metoder er en helt nødvendig del af løsningerne. Problemstillinger af denne art optræder i mange forskellige brancher. Eksempler kunne være innovation og markedsanalyse i fremstillingsvirksomheder, analyse af finansielle aktiver i finansielle institutioner, sammenhænge mellem faktorer i sundhedssektoren, genetisk baserede sygdomme i medicinalindustrien eller brug af kunstig intelligens i softwarevirksomheder.


Der er i Danmark et stort udækket behov for personer med digitaliseringskompetencer, herunder personer der kan håndtere og analysere store datamængder. Regeringen præsenterede i maj 2016 rapporten ”Redegørelse om Danmarks Digitale Vækst 2016” (1) der beskriver regeringens ambition om at ruste Danmark til en digital fremtid. Relateret hertil kom rapporten ”Virksomheders behov for digitale kompetencer” (2), der kortlægger erhvervslivets efterspørgsel og de uddannelsesmæssige udbud på området. De to rapporter underbygger begge, at der er et meget stort behov for kompetenceopbygning på digitaliseringsområdet for at sikre Danmarks vækst.


De ansøgte bachelor- og kandidatuddannelser i datavidenskab skal ses som et indspil til samfundets generelle strategiske satsning på styrkelse af digitale kompetencer - med erhvervsminister Brian Mikkelsen ord: ”.... Danmark skal være en digital frontløber, som er blandt de hurtigste og dygtigste til at tage ny teknologi til os, og hvor vi samtidigt får alle danskere med...”.


En af de digitale avenuer, der vil kunne medvirke til at sikre en frontløberposition, er en effektiv og målrettet anvendelse af de kolossale mængder af data, der i dag indsamles, men kun i begrænset omgang udnyttes. Typen af data varierer fra information om vejr og havstrømme, over information fra sundhedssektoren, til data fra de finansielle markeder eller om forbrugeradfærd. Og mængden af indsamlede data er kolossal. Dataopsamlingshastigheden i samfundet er i dag så stor, at der på to døgn produceres ligeså mange data, som der er blevet produceret fra starten af civilisationen til 2003. Og af de akkumulerede data estimeres, at man i dag har analyseret mindre end 3 %.


De computertekniske muligheder man har i dag åbner mulighed for, at man med de rette værktøjer og kompetencer vil kunne ekstrahere viden fra disse massive datapuljer langt mere effektivt end tilfældet er. En sådan viden vil kunne styrke erhvervslivets og samfundets mulighed for reelt at basere strategier og beslutninger på et solidt datagrundlag - og dermed være et vigtigt element i en datadrevet innovationsproces i virksomheder og samfund.


Aarhus Universitet vil med ansøgningerne om uddannelser inden for datavidenskab bidrage til produktion af personer, der besidder de kvalifikationer, som er en forudsætning for effektivt at kunne administrere og analysere store datamængder og gøre anvendelsen af den indlejrede viden tilgængelig og håndterbar for slutbrugerne. Hertil kræves personer med en interdisciplinær tilgang baseret på et solidt fagligt fundament inden for matematik, statistik, datateknologi og forretningsforståelse.


Kandidatuddannelsen i datavidenskab er en forskningsbaseret uddannelse, der har fokus på teoretiske, eksperimentelle og praktiske discipliner. Uddannelsen udbygger og styrker de kompetencer der opnås gennem den adgangsgivende bacheloruddannelse og giver kandidaterne udbyggede og avancerede kompetencer inden for sandsynlighedsteori, matematisk analyse og statistik, inden for metoder til organisering af store datamængder samt inden for metoder til anvendelse af data i modelbaserede fremskrivninger og scenarieanalyser.


Kandidatuddannelsen giver mulighed for en faglig fordybelse ud over bachelorniveauet, hvilket generelt vil være nødvendigt for at varetage jobfunktioner inden for datavidenskab. Kandidatuddannelsens curriculumopbygning og indbyggede valgmuligheder giver en fleksibilitet, der sikrer at den studerende kan tone uddannelsen i forhold til faglige præferencer og jobønsker. Fleksibiliteten giver samtidig mulighed for en dybere faglig profil inden for en delmængde af datavidenskab, end et mindre fleksibelt program ville gøre.


Kandidatuddannelsen er fagligt struktureret omkring følgende overordnede vidensområder (for detaljeret kompetenceprofil se upload: Dokumentationsbilag – prækvalifikationsansøgning):


-          Statistik og sandsynlighedsteori


-          Matematisk optimering og modellering


-          Regression og kritisk analyse af datasæt


-          Programmering og databaser


-          Statistical Learning og Machine Learning


Uddannelsen vil uddanne kandidater med stærke analytiske og tekniske kompetencer inden for håndtering, organisering og analyse af store datamængder og på den måde udfylde et tomrum i det danske uddannelseslandskab. I dag varetages opgaver, der kræver disse kompetencer, af personer med en uddannelse inden for et område, hvor dataindsamling og dataanalyse indgår, men ikke er et hovedfokus, som fx matematik, datalogi, fysik og økonomi. Disse dimittender er for nuværende henvist til at tilegne sig de specifikke kompetencer i forhold til håndtering af store datapuljer på mere autodidakt vis.


Kandidater fra uddannelsen i datavidenskab vil kunne finde beskæftigelse i brancher, hvor kompetencer til håndtering af store datamængder er essentielle. Det gælder fx en række sektorer inden for den finansielle sektor, medicinalindustrien, sundhedsvæsenet og meteorologien, blot for at nævne nogle. Behovet forventes at stige eksplosivt fremover som følge af den teknologiske udvikling inden for fx selvkørende transportsystemer og som følge af den større efterspørgsel efter solid og evidensbaseret information (business intelligence) der kan danne baggrund for beslutninger og strategiplanlægning.


Dimittenderne forventes således at få beskæftigelse i den finansielle sektor, i forsikringsbranchen, i den data-tunge industri (fx vindmøllebranchen), inden for medicinalindustrien, inden for forsyningsbranchen (fx el-leverandører), inden for konsulent virksomhederne og inden for store fremstillingsvirksomheder. Som eksempel på bredden af virksomheder kan henvises til den gruppe af virksomheder der har været involveret på aftagersiden i planlægningen af uddannelsen (se upload: Dokumentationsbilag –  prækvalifikationsansøgning). I de relevante virksomheder vil kandidater med en datavidenskabelig baggrund kunne varetage jobfunktioner på alle organisatoriske niveauer – fra projektmedarbejder til ledelse.


Referencer til dette afsnit:


(1) Redegørelse for Danmarks digitale vækst 2016, Erhvervsstyrelsen, maj 2016.


(2) Virksomheders behov for digitale kompetencer”, Erhvervsstyrelsen maj 2016, s. 35.


Uddannelsens konstituerende faglige elementer

Kandidatuddannelsen i datavidenskab er en forskningsbaseret uddannelse, der har fokus på teoretiske, eksperimentelle og praktiske discipliner baseret på en interdisciplinær tilgang. Uddannelsen giver udbyggede og avancerede kompetencer inden for sandsynlighedsteori, matematisk analyse og statistik, metoder til organisering af store datamængder samt metoder til anvendelse af data i modelbaserede fremskrivninger og scenarieanalyser.


Kandidatuddannelsen bygger videre på de grundlæggende elementer i bacheloruddannelsen i datavidenskab (jfr. parallel ansøgning om prækvalifikation af bacheloruddannelse) og indeholder uddannelseselementer med klart fokus på det anvendte aspekt af dataanalyse. For at sikre det anvendte fokus vil aftagervirksomheder blive inddraget gennem projektorienterede forløb på kandidatuddannelsen.


Studieprogrammet på kandidatuddannelsen vil have et samlet omfang på 120 ECTS og omfatte:


-          Obligatoriske kurser af et omfang på 20 ECTS: Advanced statistical learning (10 ECTS) og Large scale optimization (10 ECTS)


-          Et specialiseringsforløb på 30 - 60 ECTS


-          Valgfrie studieelementer på 10 ECTS


-          Et kandidatspeciale på 30 ECTS - eller 60 ECTS, hvis det er af eksperimentel karakter. Omfanget af specialet afhænger endvidere af specialiseringsretningen.


De 2 obligatoriske og konstituerende kurser er beskrevet nedenfor. Da uddannelsen udbydes på engelsk er alle kursusbeskrivelser i det følgende givet på dette sprog.


Advanced statistical learning (10 ECTS).Beginning with unsupervised learning techniques such as k-means cluster analysis and Gaussian mixtures, the course moves to dimensionality reduction through linear techniques and non-linear techniques such as kernel-PCA and isometric feature mapping. Examples are given in neuro science, image compression and signal processing. At the end of the course the student is expected to apply and explain central concepts in model evaluation and selection of variables.


Large-scale optimization (10 ECTS).This course covers large-scale algorithms for convex optimization including quasi-Newton methods, gradient and conjugate gradient methods, dual methods and interior point methods, generally and in the context of conic optimization. Applications are analyzed using optimization software. At the end of the course the student is expected to be able to explain large scale optimization algorithms in a mathematical context and apply the algorithms on real life large scale problems using optimization software.


Disse kurser er placeret på henholdsvis 1. og 2. semester og udbygger den studerendes kompetencer i forhold til bacheloren og sikrer den brede teoretiske basis for specialiseringsforløbene.


I den valgfri 10 ECTS blok kan den studerende vælge mere domænespecifikke aktiviteter, der støtter op om retningen og den studerendes faglige interesser.


Specialiseringsretningerne er opbygget, så de målretter uddannelsen mod forskellige dele af det brede jobmarked, man må forvente vil aftage kandidaterne, og giver kandidaterne den faglige højde, der er nødvendig for at varetage jobfunktionerne. Specialiseringsretningerne sikrer samtidig, at den studerende har mulighed for at tone sin uddannelse i forhold til præferencer og fremtidige jobønsker. Programmet sammensættes for den enkelte studerende individuelt og under vejledning. Dette sikrer, at der kan tages hensyn til den studerendes interesser og ønskede kompetenceprofil (jf. uddannelsesbekendtgørelsens § 22) i valg af specialiseringsretning og valgfri moduler. Samtidig sikres at programmet og at den faglige progression i programmet opfylder de krav til læringsudbytte og kompetencetilegnelse, der stilles til uddannelsen. Endvidere sikrer proceduren, at alle formelle bekendtgørelses- og studieordningsmæssige krav til uddannelsen er opfyldt. Den endelige godkendelse af den enkelte studerendes studieprogram foretages af den uddannelsesansvarlige. Når programmet er aftalt mellem den studerende og den uddannelsesansvarlige, samt godkendt, vil det være obligatorisk for den studerende. Den studerende kan ikke tilmelde sig eksamener, inden godkendelsen af specialiseringsforløbet foreligger. Programmet kan ændres, men kun efter aftale med den uddannelsesansvarlige. Nedenfor er givet fire eksempler på specialiseringsforløb, der dækker uddannelsens tværfaglige spektrum.


 


Eksempel 1. Teknisk orienteret specialisering: Forløbet er rettet mod beskæftigelse i områder, hvor der via automatiserede processer indsamles meget store datamængder (fx gennem sensorer), der efterfølgende skal analyseres og anvendes i ’real time’. Som eksempler herpå kan nævnes hele lidar-markedet, energisektoren og infrastrukturovervågning.


Forløbet indeholder 60 ECTS konstituerende kurser, der kombineres med et kandidatspeciale på 30 ECTS.


AI in Robotics (10 ECTS): Learn how to program all the key basic techniques of a robotic car. The course covers basic topics from AI of autonomous robots, including probabilistic inference, planning and search, localization, tracking and control. The course holds programming examples and assignments in the context of building self-driving cars. At the end of the course, the participants will be able to explain basic topics from AI of autonomous robots, explain probabilistic inference, explain planning and search, explain localization, explain tracking and control, and prototype the basic AI of a self-driving car.


Parallel distributed computing (10 ECTS): The goal of this course is to provide a solid, theoretical foundation for developing, analyzing, and implementing parallel and locality-efficient algorithms. To give a practical feeling for how algorithms map to and behave on real systems, algorithmic theory is supplemented with hands-on exercises on modern HPC systems, such as Cilk Plus or OpenMP on shared memory nodes, CUDA for graphics co-processors (GPUs), and MPI and PGAS models for distributed memory systems. The techniques encountered cover main algorithm design and analysis design for three major classes of machines: for multicore and many core shared memory machines, via the work-span model; for distributed memory machines like clusters and supercomputers, via network models; and for sequential or parallel machines with deep memory hierarchies such as caches. These techniques are applied to fundamental problems such as sorting, search on trees and graphs and linear algebra.


Deep Reinforcement Learning (10 ECTS): Deep Reinforcement Learning refers to the discipline of modeling and learning complex tasks using machines that are able to adapt their behavior based on experience. Students will learn about the principles of Deep Learning and will gain practical experience in applying powerful Deep Learning models for new problems expressed in the form of Reinforcement Learning. The course introduces Deep Learning models and shows how they can be appropriately adapted in order to be adopted for Reinforcement Learning tasks. At the end of the course, the participants will be able to construct and implement basic Deep Learning programs and explain how a supervised learning problem can be transformed into a Reinforcement Learning problem.


Audio Analysis (10 ECTS): Audio analysis refers to the discipline of analyzing the content of an audio signal typically recorded with a single microphone. Examples include speech and speaker recognition, auditory scene analysis, classification of music content and analysis of biomedical audio signals. Students will learn about the characteristics of audio signals, the principles of audio analysis and they will gain practical experience with this. At the end of the course, the participants will be able to explain and reason about the characteristics of audio signals, apply machine learning algorithms for speech and speaker recognition and perform auditory scene analysis on data acquired with single microphones and microphone arrays.


Natural language processing (10 ECTS): Natural language processing (NLP) is one of the most important technologies of the information age. Understanding complex language utterances is also a crucial part of artificial intelligence. Applications of NLP are everywhere because people use language in all areas of communication: web search, advertisement, emails, customer service, language translation, radiology reports, etc. There is a large variety of underlying tasks and machine learning models behind NLP applications. Recently, deep learning approaches have obtained very high performance across many different NLP tasks. These models can often be trained with a single end-to-end model and do not require traditional, task-specific feature engineering. Students will learn to implement, train, debug, visualize and invent their own neural network models. The course provides a thorough introduction to cutting-edge research in deep learning applied to NLP. On the model side the course covers topics such as word vector representations, window-based neural networks, recurrent neural networks, long-short-term-memory models, recursive neural networks, convolutional neural networks as well as some recent models involving a memory component.


Computer vision (10 ECTS): Computer Vision refers to the field studying the ability of computers to receive optical or other types of information collected by sensors and analyze this in order to make appropriate decisions. The course covers a large number of models implementing concepts of perception and pattern analysis. Students will learn about theoretical concepts behind such models and will be introduced to practical implementations constituting powerful methodologies for solving real life problems. The course covers the standard Computer Vision topics from stereo- and multi-view imaging to visual recognition of objects and scenes. At the end of the course, the participants will be able to construct and implement basic Computer Vision programs, explain basic imaging and visual recognition techniques and explain basic steps and principles involved in Computer Vision pipelines.


 


Eksempel 2: Statistisk orienteret specialisering: Forløbet er rettet mod beskæftigelse i områder, hvor fokus er på analyse og modellering af store datasæt. Dette kunne være medicinalindustrien, sundhedsvæsenet, finans- og energisektoren (fx Smart Grid og vindenergi).


Forløbet indeholder 30 ECTS konstituerende kurser, der kombineres med et eksperimentelt kandidatspeciale på 60 ECTS baseret på virkelige data.


Multivariate statistical analysis (10 ECTS): This course builds up to the more advanced courses in data science below. It treats the extension from univariate (observations on a single variable) to the multivariate (observations on many variables) case, and consider the mathematical challenges as well as the modelling opportunities this entails. At the end of the course, the participants will be able to explain pitfalls of multiple comparisons, handle multiple comparisons in practice, derive distributions of estimators and testors in linear normal models, apply these to calculations of estimates and confidence areas, make calculations in models based on the p-dimensional normal distribution using R and apply R for discriminant and classification analysis.


Analysis of high dimensional data (10 ECTS): This course introduces higher dimensional inference in the context of data science. It summarizes elements from classical multivariate analysis and moves on to treat multiple testing, false discovery rate, classification and LASSO (least absolute shrinkage and selection operator). At the end of the course, the participants will be able to explain higher dimensional inference in a mathematical context and apply LASSO in statistical and machine learning.


Computer age data inference (10 ECTS): This course treats a spectrum of topics within modern statistical inference and data analysis with emphasis on both practical exercises and theory. At the end of the course, the participants will be able to explain the theory behind and applications of Bayesian Analysis, including Empirical Bayes and Objective Bayes, Generalized Linear Models and regression trees, Bootstrapping methods, including bootstrap confidence intervals, Random Forrests, and Bagging and Boosting.


 


Eksempel 3: datalogisk/datasikkerhedsorienteret specialisering: Forløbet er rettet mod jobfunktioner, der har fokus på datasikkerhed i forbindelsen med indsamling, overførsel, analyse og anvendelse af data fra store datapuljer. Kompetencer inden for dette område vil central i alle brancher hvor det er altoverskyggende at sikre data og konfidentialitet, herunder arbejde med personfølsomme data.


Forløbet indeholder 30 ECTS konstituerende kurser, der kombineres med et eksperimentelt kandidatspeciale på 60 ECTS baseret på virkelige data.


Cryptology (10 ECTS): The course introduces cryptographic techniques for secure communication and data handling, including algorithms and the mathematics behind cryptographic constructions, basic models for security and reductions for relating security of cryptographic schemes to other schemes and computational problems. At the end of the course, the participants will be able to describe, classify and explain cryptographic techniques and concepts, evaluate and compare theoretical and practical solutions for cryptographic problems and assess security of cryptographic systems.


Cryptologic protocol theory (10 ECTS): The course presents the theory of protocols and related concepts with connections to cryptology, mathematics and complexity theory. The main areas covered include probabilistic proof systems, commitment schemes, zero-knowledge and secure distributed computing. Practical applications in areas that become important, as we perform more and more tasks in society electronically are also covered. At the end of the course, the participants will be able to describe and classify cryptographic protocols, describe and reason about models and definitions of security, prove security of given protocols.


Cryptographic computing (10 ECTS):  In modern applications, parties communicating might not trust each other and therefore need extra security guarantees. Electronic auctions, electronic voting and cloud computing are few examples of such applications. The course treats some of the advanced and state-of-the art cryptographic tools that allow two or more parties to perform any computation on their data in a way that preserves the privacy of the secret inputs and the correctness of the results, even if the system is under attack by internal and external adversaries. At the end of the course, the participants will be able to describe and explain cryptographic techniques for secure distributed computing, reason and reflect about the security of systems for private and robust computation, judge and apply cryptographic models for proving security of distributed computing, prove security of cryptographic systems.


 


Eksempel 4: økonomisk og forretningsforståelsesmæssig specialisering: Forløbet er rettet mod jobfunktioner inden for den finansielle sektor, ved store fonde og ved store virksomheder.


Forløbet indeholder 60 ECTS konstituerende kurser, der kombineres med et 30 ECTS kandidatspeciale.


Asset Pricing (10 ECTS): This course introduces fundamental concepts such as choice under uncertainty, the mean-variance framework of Markowitz and Capital Asset Pricing Model and alternative models such as Arbitrage Pricing Model and Consumption-based Capital Asset Pricing Model. Fundamentals of fixed income pricing are reviewed and methods for extracting the zero-coupon yield curve are given. At the end of the course, the participants will be able to describe, explain, and reflect on the CAPM as an equilibrium theory and relate the model to the mean-variance framework and describe and explain the expectations hypothesis, evaluate its validity empirically using standard tests, and reflect on the implications for asset pricing.


Empirical Asset Pricing (10 ECTS): This course deals with the analysis of observed stock and bond prices and returns with the aim of understanding their movement over time and across assets.  The aim of the course is partly to provide the students with tools necessary to conduct advanced empirical studies of financial market data, and partly to provide the students with a deep understanding of the determinants of stock and bond prices and returns. At the end of the course, the participants will be able to evaluate and reflect upon empirical studies using financial market data, apply econometric methods in analyzing prices and returns from financial markets and generalize the results from empirical analyses to financial market. 


Derivatives (10 ECTS): This course provides a thorough treatment of several fundamental concepts and results related to pricing and hedging of derivatives. The underlying methodological premise is the so-called arbitrage based relative pricing technique where derivatives are valued via their unique (under idealised assumptions of perfect markets) relation to prices and interest rates in underlying markets. At the end of the course, the participants will are familiar with common derivatives such as forwards, futures and vanilla options as well as with some types of exotic products such as barrier options, Asian options and lookback options. They will also master the principles of arbitrage-based pricing and are capable of applying them to the pricing and hedging of derivatives under alternative modelling assumptions. Finally, they wil be able to implement the numerical techniques necessary when dealing with highly exotic products or when analysing derivatives under complex modelling assumptions.


Financial Econometrics (10 ECTS): The main learning objective of this course is the development of quantitative and computational tools that, consistent with financial theories, allow to empirically evaluate the fairness of asset prices as well as the risks associated with holding portfolios of financial instruments. Given the empirical nature of the course, the statistical analysis of real data as well as the development of econometric and statistical methods by means of statistical software is one of the main goals. At the end of the course, the participants will be able to be able to evaluate and reflect upon empirical studies using financial markets data and apply econometric methods in analyzing prices, returns and volatilities from financial markets.


High Frequency Econometrics (10 ECTS): This course aims at teaching students how to handle large scale high frequency data and how to apply econometric methods to such data. Applications will be within areas such as econometric models of liquidity and the bid-ask spread, measurements of market quality and price discovery, measurements of volatility from high-frequency data, and aspects of high frequency and algo trading. At the end of the course, the participants will be able to handle high frequency data, including quote and trade transactions data files, and apply econometric methods on high frequency transactions data.


Time Series Econometrics (10 ECTS): The course gives a rigorous introduction to classical and modern univariate and multivariate methods in time series econometrics, including stationary and non-stationary time series in the time and frequency domain. At the of the course, the participants will be able to describe and apply a variety of structural time series models: Trend plus season plus cycle plus noise, non-stationary and trending time series processes and their relative features. They will also be able to reflect on the concept of Brownian motion and its role in limit theorems that describe the distribution of estimators and tests involving unit root processes and long memory time series processes.


Begrundet forslag til taxameterindplacering

Kandidatuddannelsen i datavidenskab ønskes placeret under det naturvidenskabelige område og foreslås indplaceret på takst 3, svarende til den indplacering der er godkendt for IT-Universitets bacheloruddannelse i Data Science.


Forslag til censorkorps
Datavidenskab er en tværfaglig uddannelse med en stærk matematisk grundfaglighed, hvorfor uddannelsen foreslås tilknyttet censorkorps for matematik suppleret med censorer fra censorkorpsene for datalogi og ingeniøruddannelserne/elektroretning.

Dokumentation af efterspørgsel på uddannelsesprofil - Upload PDF-fil på max 30 sider. Der kan kun uploades én fil.
Dokumentationsbilag_KA_datavidenskab.pdf

Kort redegørelse for behovet for den nye uddannelse

Den hastige digitale udvikling forårsager radikale samfundsmæssige ændringer og har foranlediget globale ”megatrends” som ”disruption” og ”Industri 4.0”. Denne udvikling stiller store krav til uddannelse af flere dimittender og målrettet kompetenceudvikling inden for digitaliseringsområdet. Ikke mindst i det private erhvervsliv er man bevidst herom, og der udtrykkes herfra et meget stort behov for specialiseret og højtuddannet arbejdskraft. Det eksisterende uddannelsesudbud imødekommer kun i begrænset omfang den aktuelle og forventede efterspørgsel på højtuddannet arbejdskraft med digitale kompetencer, herunder kapaciteten til at kunne systematisere det ’at lære fra data’, hvilket kræver kandidater med dybe, tværfaglige kompetencer inden for området.


Aarhus Universitets nye uddannelse i datavidenskab er udviklet med henblik på at dække dette specifikke, kvalitative behov på det danske arbejdsmarked. Uddannelsen vil herudover medvirke til at dække det store kvantitative behov for kandidater med digitaliseringskompetencer, da den forventes at kunne tiltrække et nyt segment af studerende med stor interesse og evner for matematik i anvendt sammenhæng snarere end som en ren disciplin.


OECD 2014 (1) vurderer, at digitaliseringsteknologier til behandling af store datamængder og datadrevet innovation i de seneste 5 år har haft en vækst på 40 % om året, med en estimeret markedsværdi på 17 mia. USD i 2015, og det har forøget produktiviteten for virksomheder, som bruger teknologierne, med 5-10 %. I Berlingske Toplederpanel viser en undersøgelse fra april 2016, at implementering af nye datateknologier er den højeste prioritet for 47 % af de adspurgte ledere. Ifølge nyere rapporter (2,3) forventer halvdelen af lederne, at den nuværende kerneforretning i deres virksomheder vil ændre sig væsentligt, eller helt forsvinde, inden for de næste 3 til 5 år, og den vigtigste årsag er digitalisering. Topledernes største bekymring er manglen på kvalificeret arbejdskraft. Denne bekymring deles af 62 % af dem. Behovet for digitaliseringsspecialister, hvilket inkluderer kandidater i datavidenskab, er således enormt og veldokumenteret.


I en kortlægning af virksomheders behov for digitale kompetencer, som blev lavet til Erhvervsstyrelsen i 2016 (5), skønnes det, at der i 2030 vil være en mangel på omkring 19.000 IT-specialister. Et øget optag på digitale og tekniske uddannelser er også en af anbefalingerne fra Danmarks Digitale Vækstpanel (6) som blev afleveret til regeringen i maj 2017. Behovet for IT-specialister er også fremhævet i Erhvervsministeriets redegørelse om Danmarks digitale vækst 2017 (7), hvor det fremhæves selvom danske virksomheder generelt er langt fremme med digitalisering klarer vi os dårligt på flere af de nyere vækstområder som fx analyse af kundedata, Big Data, og Internet of Things. I den sammenhæng henvises der endvidere til OECD’s analyser af hvorledes datadreven innovation og forretningsudvikling kan føre til produktivitetsforbedringer og det slås fast (side 22), at ”På sigt kan den relativt lave dataanvendelse, blive en konkurrencemæssig udfordring for Danmark".


Potentialerne i udnyttelsen af data analyse (Big Data) fremhæves i flere andre rapporter og analyser fra forskellige aktører. Eksempelvis angav Danmarks Vækstråd således som en anbefaling i 2015 eksplicit, at der skal uddannes flere data-analytikere (8). Rambøll har efter opdrag fra ITU, som har fået godkendt en bacheloruddannelse i Data Science i 2016, gennemført en analyse (9), som også klart konkluderer, at der nationalt såvel som internationalt er stor og voksende efterspørgsel på ”data scientists”.


Arbejdet med planlægning og tilrettelæggelse af uddannelsen i datavidenskab ved Aarhus Universitet har bekræftet erhvervslivets stærke interesse i og behov for dimittender i datavidenskab. Uddannelsen blev indledningsvis diskuteret med Aarhus Universitets aftagerpanel for matematik, matematik-økonomi og statistik. Her fik forslaget positiv støtte og der blev udtrykt en klar bekræftelse af behovet. Universitetet blev derfor opfordret til at gå videre med initiativet. Efterfølgende har der i udviklingsprocessen været en tæt dialog med erhvervslivet, der gennem hele forløbet har bekræftet behovet for dimittender inden for datavidenskab. Dette er der redgjort nærmere for i afsnittet ”Hvordan er det sikret at den nye uddannelse matcher det påviste behov”.


Som opfølgning på kontakten med potentielle aftagere i forbindelse med opbygning af uddannelsen har Aarhus Universitet gennem konsulentfirmaet HC Ralking gennemført en supplerende kvalitativ og kvantitativ analyse af behovet for dimittender i datavidenskab. Rapporten er indeholdt i upload: Dokumentationsbilag – prækvalifikationsansøgning. Hovedkonklusionen af undersøgelsen er:


Behovsafdækningen involverede en interviewundersøgelse hvor i repræsentanter fra 27 virksomheder deltog. Interviews er gennemført i august – september 2017. Virksomhederne blev spurgt om, hvor mange af deres ansatte med kandidateksamen eller højere, der er beskæftiget med dataanalyse. Virksomhedernes oplyste her at et antal på 1347-1569 medarbejdere er beskæftiget med dataanalyse.


Virksomhedernes svar bekræftede endvidere, at de generelt har svært ved at skaffe arbejdskraft med de rigtige kompetencer og at de derfor prøver at klare sig med, hvad de kan få. De hyppigst foretrukne profiler er fysikere, matematikere, dataloger og ingeniører. Virksomhederne rapporterer endvidere om kraftige vækstrater. En del virksomheder regner med en årlig vækst i antal ansatte på mindst 20% på dette område. Virksomhedernes samlede estimat for behovet inden for fagområdet dataanalyse over de næste 5 år ligger på mindst 600.


"I Danmark er ca. 10 – 20 ud af ca. 500 ansatte hard core i data analytics. Vi har enormt svært ved at ansætte folk med disse kompetencer. Vi kan ikke få dem. Vi flyver dem ind fra andre lande, mange fra Riga. Der er et kæmpe gap! Der er alt for få uddannet til dette. Ca. 100 – 150 arbejder med dette i Accenture i Danmark. De fleste er altså fløjet ind."


--- Kim Bech, Managing director, Accenture Digital Denmark.


I forhold til uddannelsesprofilen for datavidenskab udtrykker samtlige virksomheder sig i positive vendinger. Flere betegner det som ’Spot on’ og ’Lige det, vi har brug for’. Direkte adspurgt hvorledes Datavidenskab vil passe ind i virksomhedens planer for fremtiden tilkendegiver alle virksomheder at dimittender i datavidenskab vil passe fint med virksomhedens planer og vil udfylde et p.t. udækket behov. Virksomhederne mangler akut kompetencer inden for datavidenskab:


"Lige nøjagtigt ’Data Science’ har vi brug for. En række jobs er ’skåret til’, fordi vi ikke kan finde folk med de rette kompetencer."


--- Thomas Asger Hansen, Head of Big Data & IoT Lab, Grundfos.


Hovedparten af virksomhederne udtrykker endvidere at de gerne indgår i et tæt samarbejde med Aarhus Universitet med henblik på at bibringe dimittender i Datavidenskab en praktisk og virksomhedsnær forståelse under studiet.


Behov for arbejdskraft vil ofte afspejles gennem en lav ledighed blandt dimittender med den efterspurgte nødvendige kompetence. Der er i Danmark endnu ikke uddannet bachelorer eller kandidater inden for datavidenskab, hvorfor der ikke forefindes specifikke ledighedsestimater.  Kandidater fra uddannelserne i matematik, matematik-økonomi, datalogi og fysik har alle en meget lav ledighed og det er de kandidater, der i dag i erhvervslivet bestrider jobfunktioner relateret til håndtering af store datamængder, hvor kompetenceprofilen fra datavidenskab vil være relevant og generelt et bedre match (se også ”Hvordan er det sikret at den nye uddannelse matcher det påviste behov”). Kandidater i datalogi havde i perioden 2009-2013 en ledighed på 2,8-4,9% (opgjort 4-7 kvartal efter fuldførelsesdato) mens den tilsvarende ledighed for kandidater i matematik og matematik-økonomi svingede mellem 0,9-3,8%. Til sammenligning lå landsgennemsnittet i samme periode på 9.5-11,6% (tal for aktuel ledighed hentet fra http://ufm.dk/uddannelse-og-institutioner/statistik-og-analyser/faerdiguddannede/aktuel-ledighed). Den lave ledighed blandt disse kandidater, kombineret med det udtrykte, stærkt voksende behov for digitaliseringsekspertise generelt, betyder også, at der ikke forventes en stigende arbejdsløshed inden for disse uddannelser, som et resultat af produktion af kandidater i datavidenskab.


Kandidatuddannelse i datavidenskab udbydes på engelsk. Dette skal ses i lyset af, at fagsproget for datavidenskab og de involverede fagområder er engelsk. Samtidig ønsker vi, at give uddannelsens studerende en international dimension, der er central i en verden, hvor mange vil få ansættelse i virksomheder med en global udbredelse, hvor engelsk ofte er koncernsprog. Udbuddet på engelsk betyder endvidere at universitetets internationale stab af stærke forskere, kan udnyttes optimalt i uddannelsesfaglig sammenhæng.


Referencer til dette afsnit:


(1) OECD (2014), Data-driven Innovation for Growth and Well-being.


(2) Topchefer: Kerneforretningen vil dø om tre til fem år. Berlingske toplederpanel, onsdag d. 27. april 2016.


(3) Redegørelse for Danmarks digitale vækst 2016, Erhvervsstyrelsen, maj 2016.


(4) A future that works, McKinsey & Company og Aarhus Universitet, maj 2017.


(5) Højbjerre, Brauer og Schultz. Virksomheders behov for digitale kompetencer, Erhvervsstyrelsen, maj 2016.


(6) Danmark som digital frontløber – anbefalinger til regeringen fra Digitalt Vækstpanel, 2017.


(7) Redegørelse om Danmarks digitale vækst 2017. Erhvervsministeriet, side 6.


(8) Danmarks Vækstråd, Anbefalinger vedr. datadreven udvikling og vækst, 2015


(9) Markedsundersøgelse for Data Science. Rambøll og IT-Universitetet i København, maj 2016, side 4.


Underbygget skøn over det samlede behov for dimittender

I forbindelse med udviklingen af de nye bachelor- og kandidatuddannelser i datavidenskab har Aarhus Universitet gennemført en kvantitativ undersøgelse af behovet for uddannelsen hos en række virksomheder. Undersøgelsen er baseret på interviews med relevante virksomhedsrepræsentanter omkring virksomhedens behov for dimittender inden for datavidenskab.


De 27 virksomheder som indgik i behovsafdækningens interviewundersøgelse udtrykte et samlet estimat for behovet inden for fagområdet dataanalyse over de næste 5 år mindst 600 personer, i det omfang de kan skaffes (se upload: Dokumentationsbilag – prækvalifikationsansøgning).


Kandidatuddannelsen i datavidenskab ved Aarhus Universitet vil primært rekruttere fra den ansøgte bacheloruddannelsen i datavidenskab ved Aarhus Universitet. Der optages i førsteomgang 30 studerende på bacheloruddannelsen, med en ambition om at øge antallet til 60 henover de følgende år. Det forventes derfor, at der vil være en intern rekruttering i størrelsesordenen 20-25 studerende første år stigende til 40-50 de efterfølgende år. Hertil kommer optag fra andre uddannelser og universiteter - et optag der indledningsvis næppe vil overstige 10-15 per år.


Samlet er forventningen således, at der vil blive produceret omkring 30-40 kandidater til arbejdsmarkedet fra første optagelsesårgang, stigende til 50-65 om året ved fuld indfasning. Givet den aktuelle store efterspørgsel på kompetencer inden for datavidenskab forventes det ikke, at arbejdsmarkedet vil have problemer med at absorbere denne produktion. Snarere forventes det, at der vil være en betydeligt større efterspørgsel på dimittender på datavidenskab. Der kan derfor blive behov for løbende at foretage en vurdering af mulighederne for et større optag.


Hvilke aftagere/aftagerorganisationer har været inddraget i behovsundersøgelsen?

Indledningsvist blev der taget en dialog med aftagerpanelet for matematik, matematik-økonomi og statistik ved Aarhus Universitet bestående af:


Anne Lund Christophersen (formand), Vestas, Tue Rauff Lind Christensen, TDC, Søren Dahlgaard, Nordea Bank Danmark A/S, Dinna Balling, Viby Gymnasium, Maja Tarp, Novo, Søren Have, Rambøll, Lasse Broby Rieks, Aarhus Katedralskole.


Den efterfølgende proces har involveret 27 virksomheder. Disse blev udvalgt sådan at de dels dækker alle relevante anvendelsesområder for datavidenskab, dels repræsenterer såvel det nationale som det lokale erhvervsliv og inkluderer virksomheder af forskellig størrelse samt inkludere både private og offentlige aftagere. En samlet liste over involverede virksomheder findes i upload: Dokumentationsbilag – prækvalifikationsansøgning.


Samarbejdet med den aftagergruppe, der har været involveret i opbygningen af uddannelsen, forventes at forsætte, hvis uddannelsen godkendes. Der vil jfr. Universitetsloven blive etableret et aftagerpanel for uddannelsen bestående af repræsentanter fra de virksomheder, der har været mest aktive i udviklingsprocessen. Virksomhederne vil også blive inddraget aktivt i undervisningen, hvilket der generelt er udtrykt stor interesse for i behovsundersøgelsen. Dette vil ske gennem deltagelse som gæsteforelæsere og gennem bidrag med realistiske data cases, som de studerende kan arbejde med i deres projekter. Virksomhedsrepræsentanter vil også blive inddraget som eksterne medvejledere i forbindelse med projekter der gennemføres sammen med aftagere.


Hvordan er det sikret, at den nye uddannelse matcher det påviste behov?

Design, kompetenceprofil og curriculum for uddannelsen er et resultat af en iterativ proces mellem de involverede institutter og aftagere. En proces der har haft til formål at sikre, at uddannelsen har relevans for arbejdsmarkedet og at uddannelsens dimittender kan imødekomme de krav og behov, som virksomhederne har for kompetencer inden for datavidenskab.


Som ovenfor nævnt blev oplægget til uddannelsen indledningsvis diskuteret med aftagerpanelet for matematik, matematik-økonomi og statistik. Efterfølgende blev der taget kontakt til og afholdt møder omkring uddannelsen med Region Midt, ITForum, Epinion, Kapacity og LandIT, der alle tilkendegav deres støtte til initiativet og udtrykte forventning om stort behov for dimittenderne grundet det hastigt voksende forretningsmæssige potentiale i området.


Efterfølgende har institutleder for Matematisk Institut, Niels Ovesen Nygaard, sammen med instituttets erhvervskonsulent deltaget i en række industrikonferencer, hvor den faglige baggrund, indhold og rammer for uddannelsen er blevet fremlagt og positivt modtaget. Primo maj blev der afholdt en workshop med deltagelse af centrale medarbejdere fra Energinet, Enversion, Epinion, Grundfos, ITMINDS, Kapacity, Niras, Rambøll, Solitworks, Stibo-Accelarators, Uber og Vestas (se nærmere beskrivelse i upload: Dokumentationsbilag – prækvalifikationsansøgning). Fokus for workshoppen var, at få afklaret om kompetenceprofilen for datavidenskab matchede virksomhedernes behov, og om dimittender med anden baggrund eventuelt kunne dække området. Disse virksomheder er alle karakteriseret ved i dag at arbejde med analyse af og anvendelse af information fra store datamængder, opgaver der p.t. løses i dag af kandidater med baggrund i matematik, matematik-økonomi, statistik, datalogi/it, fysik og business intelligence. Virksomhederne pegede entydigt på, at behovet for kompetencer inden for feltet ikke er imødekommet hermed. Der er et uopfyldt behov for dimittender med dybe, tværgående kompetencer, der kan arbejde på tværs af disciplinerne, svarende til kompetenceprofilen for datavidenskab.


Ud over støtte til uddannelsen og ønske om at kunne ansætte personer med disse kompetencer, har virksomhederne bredt tilkendegivet, at de gerne deltager mere praktisk i uddannelsen. Det kunne være gennem gæstedeltagelse i undervisning, deltagelse i projektorienterede forløb (herunder bachelorprojekter og på kandidatuddannelsen også specialer), gennem tilvejebringelse af konkrete cases og tilhørende datasæt, karrierearrangementer, deltagelse i mentorordninger eller som medlemmer af aftagerpaneler.


Sammenhæng med eksisterende uddannelser

Den ansøgte kandidatuddannelse i datavidenskab er den eneste kandidatuddannelse af sin art i Danmark, hvorfor der ikke findes et umiddelbart sammenligningsgrundlag. Uddannelsen i datavidenskab giver udbyggede og avancerede kompetencer inden for sandsynlighedsteori, matematisk analyse og statistik, metoder til organisering af store datamængder samt metoder til anvendelse af data i modelbaserede fremskrivninger og scenarieanalyser og rækker ud mod områder som statistik, ingeniørvidenskab og økonomi hvor analyse af store datamængder er i fokus. Dele af dette curriculum er repræsenteret i andre uddannelser, hvor det dog ikke indbygges i den tværdisciplinære faglige sammenhæng, der kendetegner datavidenskab. Overordnet kan disse kategoriseres omkring matematik, anvendt matematik, matematik-økonomi, datalogi og ingeniørtekniske.  Samlet drejer det sig om de uddannelser der er listet nedenfor. En detaljeret gennemgang af disse uddannelser i forhold til den ansøgte kandidatuddannelse i datavidenskab er i øvrigt givet i upload: Dokumentationsbilag - prækvalifikationsansøgning.


1. Matematik:


Kandidatuddannelsen i matematik, Aarhus Universitet


Kandidatuddannelsen i matematik, Københavns Universitet


Kandidatuddannelsen i matematik, Syddansk Universitet


Kandidatuddannelsen i matematik, Roskilde Universitet


Kandidatuddannelsen i matematik, Aalborg Universitet


2. Anvendt matematik:


Kandidatuddannelsen i anvendt matematik, Syddansk Universitet


Kandidatuddannelsen i forsikringsmatematik, Københavns Universitet 


3. Matematik-økonomi:


Kandidatuddannelsen i matematik-økonomi, Aarhus Universitet


Kandidatuddannelsen i matematik-økonomi, Københavns Universitet


Kandidatuddannelsen i matematik-økonomi, Syddansk Universitet


4. Datalogi:


Kandidatuddannelsen i datalogi, Aarhus Universitet


Kandidatuddannelsen i datalogi, Københavns Universitet


Kandidatuddannelsen i datalogi, Syddansk Universitet


Kandidatuddannelsen i datalogi, Roskilde Universitet


Kandidatuddannelsen i datalogi, Aalborg Universitet 


Kandidatuddannelsen i IT-produktudvikling, Aarhus Universitet


5. Ingeniørtekniske:


Civilingeniør (kandidatuddannelse) med specialisering i Big Data, Danmarks Tekniske Universitet


 



Kandidater fra uddannelserne i matematik, matematik-økonomi, datalogi, der i forhold til datavidenskab er de mest beslægtede uddannelser, har alle en lav ledighed 0,9 % - 4,9 % for perioden 2009-2013 (opgjort 4-7 kvartal efter fuldførelsesdato, data fra Uddannelses- og Forskningsministeriet, http://ufm.dk/uddannelse-og-institutioner/statistik-og-analyser/faerdiguddannede/aktuel-ledighed). For naturvidenskabelige uddannelser generel var ledigheden i periode 11,5 % - 13,5 %.



Rekrutteringsgrundlag

Uddannelsen forventes primært at rekruttere fra den ansøgte bacheloruddannelse i datavidenskab ved Aarhus Universitet, og i mindre grad fra andre bacheloruddannelser, der opfylder adgangskravet (se afsnit ”Hvilke adgangskrav gælder for uddannelsen?”). Det forventes derfor ikke at udbuddet af datavidenskab vil påvirke rekrutteringen til andre STEM uddannelser i væsentlig grad. Uddannelsen udbydes på engelsk og vil derfor være åben for internationale studerende med interesse.


Forventet optag


Der forventes at blive optaget 30-50 studerende på uddannelsen i opstartsåret, med et forventet øget optag over de efterfølgende 3-4 år til 50-65 studerende.



Hvis relevant: forventede praktikaftaler

Ikke relevant.


Hermed erklæres, at ansøgning om prækvalifikation er godkendt af institutionens rektor
Ja

Status på ansøgningen
Godkendt

Ansøgningsrunde
2017-2

Afgørelsesbilag - Upload PDF-fil
A6 - Foreløbig godkendelse af ny uddannelse - KA i Datavidenskab - AU.pdf

Samlet godkendelsesbrev
Orientering til AU - Godkendelse af ny uddannelse - Kandidatuddannelsen i Datavidenskab.pdf