Akademisk overbygningsuddannelse - Data stewardship - Københavns Universitet
Uddannelsen er udviklet, så at akademiske bachelorer fra alle fem hovedområder kan følge uddannelsen. Det kunne eksempelvis være en BSc i biologi fra det naturvidenskabelige hovedområde, en BA i historie eller informationsvidenskab fra det humanistiske hovedområde, en BSc Eng. i byggeteknologi fra det teknisk videnskabelige hovedområde eller en BA i jura fra Det samfundsvidenskabelige hovedområde. Alle akademiske bachelorgrader fra akkrediterede videregående uddannelsesinstitutioner er i udgangspunktet adgangsgivende. Der er ingen retskravsbachelorer til uddannelsen.
En data steward er en dataspecialist med et fagligt indblik, der forstår betydningen og relevansen af forskellige data og dennes anvendelse i forskellige fagområder og tilhørende processer. En data steward er det menneskelige bindeled, der kobler organisationens infrastruktur, data og de personer, som gerne vil gøre brug af data sammen. En data steward sikrer, at data bliver opsamlet, håndteret og opbevaret, så det kan udnyttes optimalt ift. udvikling af forretningen, processer og forskning - såvel internt som i eksterne samarbejder nationalt og internationalt.
Data stewards ansættes i mange forskellige virksomheder, organisationer og fagområder, der arbejder med forskellige dataformater, typer og genstande. Derfor er grundtanken med data steward-uddannelsen at uddanne dimittender fra forskellige bachelorbaggrunde i dataforståelse, -modellering, -opsamling og -håndtering inden for og i forlængelse af deres bachelorfaglighed. Da uddannelsen kombinerer emner som anonymisering, information og dataetik med viden om disciplinspecifik data og datahåndteringsprocesser, vil uddannelsen bygge videre på eksisterende fagforståelse og på kort tid give dimittenderne nye karrieremuligheder.
Uddannelsesstrukturen beskrevet nedenfor tager udgangspunkt i følgende centrale data steward-opgaver:
- Optimere data workflows, herunder evaluer og identificere problemer samt koordinere, udvikle og implementere ændringer.
- Facilitere den konkrete anvendelse af data internt og eksternt i organisationen i forbindelse med deling af data for at udnytte datas potentiale i udviklingen af virksomheders proces-, forretnings- og forskningsområder.
- Skabe og vedligeholde processer og procedurer for databehandling og dokumentation. Dette indkludere håndhævelse af politikker og standarder der beskytter data.
- Have ejerskab og ansvar for data og datakvalitet og ansvar for at sikre sammenhæng, koordinering og kobling mellem dataanvendelse, -kvalitetssikring og -sikkerhed.
- Oplyse om potentielle risici og lovgivningsmæssige krav i databehandling og dokumentation.
- Hjælpe brugere eller kundere med at udvikle og implementere bedst praksis i dataanvendelse og datapublicering, samt sikre overholdelse og sikkerhed af dataene.
- Undervise, vejlede og samarbejde.
Uddannelsens opbygning
Den etårige data steward-uddannelse består af 60 ECTS, hvoraf 30 ECTS er konstituerende og 15 ECTS er begrænset valgfri. De sidste 15 ECTS udgøres af et konstituerende, afsluttende projekt. Uddannelsen udbydes i blokstruktur, hvor studerende i hvert af studieårets fire blokke typisk følger 2 kurser af 7,5 ECTS.
Som angivet ovenfor er adgangskravet til data steward-uddannelsen en akademisk bachelorgrad fra en videregående uddannelsesinstitution. I praksis vil dette betyde, at de studerende kan indskrives med vidt forskellige baggrunde og specielt også forskellige tekniske kvalifikationer. Nedenfor anføres uddannelsens opbygning med udgangspunkt i en studerende, der ikke på forhånd har indgående kendskab til uddannelsens konstituerende fagområder. Tilsvarende beskriver kompetenceprofilen de minimumskompetencer, som enhver data steward vil have efter endt uddannelse.
Alle studerende, der optages på uddannelsen, tilbydes en vejledningssamtale før studiestart, hvor der lægges en plan for valg af domæne- og metodespecifikke kurser i forhold til den studerendes adgangsgivende eksamen og ønske til faglig og erhvervsmæssig toning.
Studerende, hvis kvalifikationer har et fagligt overlap til nogle af de obligatoriske kurser, tilbydes et alternativt forløb.
Uddannelsens fire blokke indeholder følgende kurser (se også kassogrammet på side 3 i bilaget):
Blok 1
- Python for Data Science (7,5 ECTS)
- Data Governance (7,5 ECTS)
Blok 2
- Datamodellering, -management og -sikkerhed (7,5 ECTS)
- Begrænset valgfrit-1 - (Domænekursus 7,5 ECTS)
Blok 3
- Dataanalyse & -processer (7,5 ECTS)
- Projekt (15 ECTS i Blok 3+4)
Blok 4
- Begrænset valgfrit-2 - (Metodespecialisering, 7,5 ECTS)
- Projekt (15 ECTS i Blok 3+4)
Her præsenteres kursernes sammenhæng og progression kort. De enkelte kurser/fagelementer beskrives i detaljer efterfølgende.
Kurserne i Blok 1 tilvejebringer det grundlæggende fundament inden for data science, data stewardship, computational thinking og data governance.
Kurserne i Blok 2 bygger videre på kurserne fra Blok 1 gennem dels kompetencer som datamodellering, -management og -sikkerhed, der giver teoretiske, tekniske og praktiske færdigheder til at realisere principperne fra eksempelvis Data Governance-kurset. Det andet kursus i blok 2 udgør den første del af uddannelsens specialiseringsmuligheder. Kurset giver de studerende mulighed for at vælge et kursus, der etablerer domænespecifikt data i forhold til både typer, opbygning og brug. Domænet vil typisk vælges, så det ligger i forlængelse af den studerendes bachelorfaglighed eller eventuelle erhvervsbranche.
Kurset i Blok 3 binder Blok 1 og 2 sammen ved at fokusere på automatisk analyse af data og automatisering af processer omkring dataopsamling, behandling og lagring. Kurset indeholder samtidig et væsentligt element af formidling i forhold til organisatorisk implementation af nye processer.
Kurset i Blok 4 giver de studerende deres anden specialiseringsmulighed. I modsætning til det første valgfri kursus (der fokuserede på det særegne ved data inden for et givet anvendelsesområde) giver dette kursus de studerende mulighed for at specialisere sig rent metodemæssigt inden for eksempelvis machine learning, change management, open data & FAIR eller citizen science.
Det afsluttende projekt på 15 ECTS forventes at samle alle uddannelsens fagområder gennem et større afsluttende arbejde inden for data stewardship. Projektets læringsmål formuleres i samarbejde med vejleder og kan med fordel gennemføres i samarbejde med en virksomhed eller et aktivt forskningsmiljø.
Kompetenceprofil
Uddannelsen står overordnet på tre faglige ben: IT-kompetencer, juridiske og etiske kompetencer samt domænespecifikke datakompetencer, der konkretiseres gennem kompetenceprofilen:
Viden om
- Strukturering, lagring, behandling og visualisering af data. Herunder hvordan nævnte dataprocesser kan indgå i datavidenskabsprocesser, produkter, løsninger, forretning- og procesudvikling og forskning baseret på eksempelvis machine learning og kunstig intelligens.
- Etablerede principper og rammer for god dataskik - eksempelvis FAIR.
- Lovgivning og dataetiske problemstillinger ved opsamling, opbevaring og brug af data. Herunder specielt personfølsomme data og privacy.
- Tekniske og policy aspekter af it-sikkerhed i forhold til eksempelvis indsamling, opbevaring og deling af data.
- Grundlæggende principper for moderne dataanalyse.
Færdigheder i
- Skrive mindre programmer til automatisering af dataopsamling, -oprensning, -lagring, og behandling; herunder principper for computationel thinking inklusive dekomposition, mønstergenkendelse, abstraktion og algoritmer.
- Gennemføre mindre eksplorative dataanalyser.
- Dokumentere datamodeller- og flow.
- Formidling og organisatorisk forankring af processer, strukturer, regler og rammer i relation til bl.a. dataopsamling, -behandling, -lagring, -deling og -brug.
Kompetencer til at
- Indgå selvstændigt i fagligt og tværfagligt samarbejde med dataanvendere inden for uddannelsens vidensområder.
- Tage ansvar for dataprocesser.
- Opdele større problemer i mindre, lettere tilgængelige delproblemer.
- Vælge mellem mulighederne, men inden for begrænsningerne, i fagenes forskellige metodevalg.
- Løse problemer, der kræver kombination af dataviden med viden fra mindst et andet fagområde, identificere egne læringsbehov og tilegne sig den nødvendige viden.
Uddannelsens fagelementer
Uddannelsens konstituerende fagelementer
Python for data science (konstituerende, 7,5 ECTS) Introduktion til computational thinking og programming i en data sciencekontekst, herunder datatyper, betingede sætninger og løkker. Desuden introduceres objektorienteret programmering, pattern matching og beregningskompleksitet samt grundlæggende algoritmisk forståelse. Der opnås kompetencer til at skrive mindre velstrukturerede og dokumenterede programmer, der kan løse typiske data science problemer.
Data governance (konstituerende, 7,5 ECTS) Introduktion til informations- og dokumentationskrav som Data Protection Impact Assessments (PIA), databehandleraftaler og Data Protection Officers rolle og ansvar. Desuden ikke-retlige instrumenter/principper, der kan understøtte privatlivsbeskyttelse og god dataskik, herunder privacy by design og FAIR-principperne. Der fokuseres også på dataetik ved udvikling og brug af databehandling, herunder styring af tilgængelighed, brugbarhed, integritet og sikkerhed af data i private og offentlige organisationer. Målet med kurset er at den studerende kan identificere og formulere problemstillinger inden for data stewardship i det bredere samfundsperspektiv samt snævre virksomhedsperspektiv, herunder dataetiske konsekvenser, dataejerskab, ansvar, compliance, privatliv, GDPR og dataetik.
Datamodellering, -management, og -sikkerhed (konstituerende, 7,5 ECTS) Grundlæggende principper og metoder til modellering af data og metadata; herunder en introduktion til eksempelvis ontologier, relationelle databaser og modellering af samme gennem eksempelvis ER-modeller. Grundlæggende principper for datamanagement: med udgangspunkt i simple databaseløsninger introduceres mere avancerede begreber til håndtering af store datamængder fra multiple datakilder som eksempelvis datasøer og data wharehouses. Endelig introduceres begreber og teknikker indenfor it- og datasikkerhed til at understøtte og implementere robust og sikker opbevaring, håndtering og deling af data.
Dataanalyse & -processer (konstituerende, 7,5 ECTS) I kurset introducerer de grundlæggende processer i en data science pipeline; herunder dataopsamling, -oprensning, -integration, -visualisering, og analyse. Der lægges vægt på, hvordan de enkelte delprocesser kan automatiseres gennem scripting (i eksempelvis R) og egentlig programming (i eksempelvis Python). Der fokuseres på at formidle kompetencer indenfor specielt grundlæggende data-visualisering og -analyse. Gennem kurset lægges, der desuden vægt på, at de studerende opøver kompetencer i simpel og klar formidling af modellerede processer, analyser og visualiseringer.
Afsluttende projekt (konstituerende, 15 ECTS) Projektet udgør afslutningen på overbygningsuddannelsen, hvor uddannelsens obligatoriske elementer i samspil med de valgte domæne- og metodespecialiseringskurser anvendes til at analysere, beskrive og løse en mindre data stewardopgave. Projektet kan skrives i samarbejde med virksomhed, offentlig institution eller et forskningsmiljø. Der opnås viden og færdigheder om, hvordan en Data Steward problemstilling analyseres, dokumenteres og løses med udgangspunkt i en klar problemformulering og inddragelse af relevante data og aktører og litteratur. Der opnås kompetencer til videreudvikle egen viden og færdigheder samt gennemføre et mindre, selvstændigt projekt inden for det faglige område.
Uddannelsens begrænset valgfri fagelementer
Domæne-/anvendelsesområdespecifikke kurser i Blok 2
Sundhedsdata (7,5 ECTS) Kurset omhandler sundhedsdata og digitale dataanvendelser i den danske sundhedssektor. Sektorens primære datakilder, dataflow og databrugere introduceres; herunder den danske registerstruktur og de centrale formål med indsamling af sundhedsdata. De væsentligste typer af sundhedsdata gennemgås; herunder klassifikationssystemer og datastandarder. Der opnås kompetencer til selvstændige analyser af datakvalitet, standarder og interoperabilitet. Endelig introduceres de centrale juridiske rammer samt politiske og dataetiske overvejelser i forbindelse med opsamling og brug af sundhedsdata.
Sekvensdata og bioinformatik (7,5 ECTS) Kurset introducerer de grundlæggende processer og metoder i forbindelse med generering og behandling af high throughput genetisk data. Der opnås indledningsvis en forståelse for de laboratoriemetoder og biologiske processer, der genererer genetisk data, eksempelvis cDNA analyse, ChIP, RNA-sekventering, microarray - herunder styrker og svagheder ved de enkelte metoder og kvaliteten af de resulterende data. Herefter fokuseres på opnåelse af forståelse for den samlede analyse-pipeline, der benyttes fra dataopsamling over dataopbevaring, til datarensning, visualisering og til sidst egentlig analyse. Dette inkluderer en introduktion til typiske standardværktøjer egnede til specifikke delopgaver i analyse-pipelinen samt eksempler på hvordan de kædes sammen til automatiserede databehandlingskæder. Kurset introducerer også elementer af FAIR i kontekst af bioinfomatik med specielt fokus på datakvalitet, datagenbrugelighed og datatilgængelighed.
Sociale data (7,5 ECTS) Kurset introducerer til centrale former for socialvidenskabelig data, registerdata, spørgeskema- og interviewdata samt digitale spordata (især fra sociale medier). Kurset fokuserer på tre moduler: dataopsamling, dataopbevaring og deling, samt datakvalitet. Dataopsamlingsmodulet vil give den studerende analytiske værktøjer og metoder til dataopsamling indenfor de tre dataformer; herunder sampling metoder, spørge- og søgemetodikker samt konsekvenser for det endelig datasæt. Dataopbevarings- og -delingsmodulet vil fokusere på de specifikke udfordringer i at opbevare og dele social videnskabelige data, herunder personfølsomme data, samt store mængder kvalitative data i form af tekst fra sociale medier eller interviews. Datakvalitetsmodulet introducerer målekvalitets- og validitetsteori samt deres konsekvenser for socialvidenskabelige data i forbindelse med dataanalyse.
Organisations- & kulturdata (7,5 ECTS) Kurset introducerer kulturdata, omfattende data genereret af og arkiveret i kulturorganisationer. Modulet fokuserer på kulturdata i forhold til dataopbevaring, linking og tilgængeliggørelse af data, såsom lukkede, Open og FAIR-data, herunder datamodellering og datavisualisering, mv., samt i en forretningsorienteret vinkel omkring management af brugsdata (logdata, kundedata, besøgsdata, interaktionsdata (opsamlet på festivaler, udstillinger, m.m.). Specifikke forhold ved copyright inddrages. Kurset vil gør den studerende i stand til at forstå og arbejde med den strategiske sammenhæng mellem metoder og midler og den kontekst, der danner baggrunden for arkivering, adgang til og formidling af kulturdata.
Metodespecialiseringskurser i Blok 4
Machine learning og kunstig intelligens (ML/AI) (7,5 ECTS) Kurset i machine learning og kunstig intelligens giver en teoretisk og praktisk introduktion til machine learning og kunstig intelligens. Med udgangspunkt i en kort introduktion til statistisk læring og sandsynlighedsteori dækkes supervised learning og unsupervised learning herunder klassifikation og regression. Igennem kurset arbejdes der med konkrete algoritmer/data og implementation/brug af samme. Der opnås kompetencer til gennemføre mindre machine learning baserede analyser og modeludvikling samt viden om konkrete værktøjers begrænsninger og muligheder. Endelig opnås der en forståelse for implikationerne (tekniske og etiske) ved at anvendelse af machine learning baserede modeller samt potentielle faldgruber/overvejelser i kraft af eksempelvis explainable AI, bias og generalisering.
Open Data & FAIR (7,5 ECTS) Kurset behandler FAIRification workflow, herunder elementerne i et teknisk ecosystem, der understøtter FAIR. Dette inkluderer bl.a. FAIR Data Management, opbygning af en FAIR-semantisk datamodel og transformering af data til et FAIR-format, der sigter på at data er Findable, Accessible, Interoperable og Reusable på langt sigt. Formålet med kurset er, at den studerende får færdigheder i at skabe FAIR datasets ved at sikre data’s teknisk og semantisk interoperabilitet, herunder identificere og anvende relevante filformater, teknikker i rensning og harmonisering af data, metadata standarder, og vejlede om licenser for brug af data samt udarbejdelse af dokumentation for at sikre genanvendelighed af data. I løbet af kurset kommer den studerende til at diskutere udfordringer og ambitioner med FAIR-data i en organisation, herunder dennes mission, mål, forventninger og datapolitik samt behov for kompetenceudvikling i en organisation for at fremme FAIR. Dermed skal den studerende have viden om interoperabilitet mellem data & systemer, både internationalt som for eksempel i EOSC, nationalt og på tværs af organisationer i et større perspektiv.
Projektledelse/change management (7,5 ECTS) Kurset sætter projektledelse og formidling i en organisatorisk ramme, herunder hvordan den studerende i rollen som data steward kan lede og formidle digitalisering, opbevaring og tilgængeliggørelse af data i forhold til individuelle, sociale, kulturelle og funktionsmæssige forskelle i en organisation. Kurset vil kvalificere deltagerne til at indgå i en faglig dialog om organisationsforandring og innovative processer i forbindelse med implementering af FAIR-data principper i en organisation. Kurset vil introducere projektstyringsmetoder og -værktøjer og den studerende vil i kurset arbejde med en case som omfatter implementeringen af forandringsprocesser og formidling af disse i en organisation.
Citizen Science (7,5 ECTS) Citizen Science styrker videnskabssamfundets kapacitet og ved at demokratisere forskning øges offentlighedens forståelse af videnskab og forgriber nødvendigheden af åbne videnskabelige og politiske videnskabelige processer. Dette giver mulighed for at styrke forskningsfelter hvor manglende ressourcer er en hindring for dette. Kurset retter sig mod data stewardship i citizen scienceprojekter, der udføres i samarbejde med både forskningsinstitutioner, offentlige organisationer og den private sektor. Kurset vil klæde den studerende på til at være bindeleddet mellem borgerne, datainfrastrukturen, projektets styregruppe/projektgruppe og gældende politikker/protokoller. Den studerende vil opbygge kompetencer og færdigheder i udvikling og brug af platforme og værktøjer designet til at supportere borgerdrevet dataindsamling herunder dokumentation af dataindsamlingsmetoder; praktisk anvendelse af modeller for validering og håndtering af data der sikrer datakvalitet for at maksimere anvendelighed og integration af data, og færdigheder i at udarbejde hensigtsmæssige data workflows. Derudover, vil den studerende arbejde med synlighed af projektet i data repositorier således, at det kan findes og genbruges af andre, herunder best practices i hvordan data og resultater stilles til rådighed for offentligheden.
Yderligere valgfri kurser
De begrænset valgfrikurser beskrevet ovenfor udgør sammen med de konstituerende elementer uddannelsens grundstamme. De begrænset valgfri kurser vil dog i praksis kunne erstattes af relevante kurser fra Københavns Universitets almindelige og betragtelige kursuskatalog. Relevans vil blive vurderet i forhold til den studerende bachelorbagrund, faglige forudsætninger og den samlede uddannelses sammensætning/profil.
Profiler
Studerende kan starte på den etårige data steward-uddannelse med mange forskellige akademiske bachelorbaggrunde. De to valgfri kurser giver mulighed for at fokusere deres uddannelse inden for et specifikt datadomæne og tilsvarende inden for en af flere forskellige metodespecialiseringer.
Kombinationen af bachelorbaggrund og specialiseringsvalg vil give mulighed for en data stewarduddannelse og dermed erhvervssigte med tydelig toning profil. Nedenfor ses eksempler på profiler, der understøttes af de planlagte specialiseringskurser. Uddannelsen vil på sigt udvides med flere kurser og dermed profiler tilpasset samfundets behov.
Profil 1: BA historie/kunsthistorie + Organisations- og kulturdata + Citizen Science
Bachelorer med en baggrund fra historie/kunsthistorie eller tilsvarende har en indgående kendskab til historiske hovedlinier, epoker, problemstillinger og formidling af samme. En kombination med specialiseringskurserne i Kulturdata og Citizen Science vil give en samlet data steward-profil, der kan hjælpe med at digitalisere og systematisere historiske kulturdata af historisk betydning og hvor det er relevant benytte Citizen Science til at fremme digitaliseringen og indsamling af ukendt eller uregistreret data.
Profil 2: BSc Biologi + Sundhedsdata + ML/AI
Bachelorer med en baggrund fra biologi eller tilsvarende har indgående kendskab til biologiske processer og kemiske processer. En kombination med specialiseringskurserne i Sundhedsdata og ML/AI vil give en data steward-profil, der har relevant domænekendskab fagligt og datamæssigt og kan hjælpe med at indsamle, kuratere og forberede sundhedsdata med henblik på efterfølgende ML/AI baseret analyse og produkt-/serviceudvikling.
Profil 3: Informationsvidenskab + Sociale data + ML/AI
Bachelorer med en baggrund fra informationsvidenskab har stor viden om samspillet mellem registrering, organisering og søgning af data og etiske problemstillinger ved samme. En kombination med domænekursus i Sociale data og metodespecialisering i ML/AI vil give en data steward-profil, der kan organisere og bearbejde sociale data, herunder oprensning af data og visualisering af samme. Dette med henblik på at skabe grundlaget for etablering af ny viden om f.eks. brug af organisationers informationssystemer og hermed medvirke til at styrke samspillet mellem organisationer og deres brugere for en mere effektiv udnyttelse af brugsdata og etiske aspekter forbundet hermed.
Profil 4: BA Teologi + Organisations- og kulturdata + Projektledelse/change management
Bachelorer fra teologi er kendetegnet ved at kunne arbejde systematisk og gå i dybden med faglig stof samt arbejde med relationer, processer og kommunikation. En kombination med specialiseringskurserne i organisations - og kulturdata og projektledelse/change management vil give en samlet data stewardprofil, der kan hjælpe med tilpasning og forståelse af data politikker og funktioner i dataservices og menneskelig problemstillinger i interaktion med data og datainfrastruktur i en organisation.
Profil 5: BA Jura + Sundhedsdata + Open Data & FAIR
Her kombineres en bachelor i jura med specialiseringskurserne Sundhedsdata og Open Data & FAIR. Det vil samlet give en health data steward-profil, der kan hjælpe med principper og praksis i brug af personlig sundheds- og forsøgsdata. Dette inkluderer, men er ikke begrænset til sikring af dataindsamlingsprocesser, publicering, opbevaring, deling og integration af sundhedsdata fra forskellige parter, men på samme tid med respekt for regler/lovgivning i forhold den enkelte persons privatliv og fortrolighed.
Profil 6: Bsc Geografi + Organisations og kulturdata + Open Data og FAIR
Bachelorer med en baggrund fra geografi har indgående kendskab til de udfordringer indsamlingen af store datasæt stiller til en organisation. Dette gælder specielt data som har en relevans for byplanlægning og miljørelevante data på kommunalt, regionalt og statslig niveau. Her tænkes f.eks. på GIS-baserede datasæt. Ved at kombinere geografers indgående kendskab til store datasæt med specialiseringskurser i Organisations- & kulturdata og Open Data & FAIR vil kandidaten have et stærkt udgangspunkt for at indgå i projekter, der fordrer et kvalificeret kendskab til organisationelle processer og viden om håndtering af data med udgangspunkt i FAIR-principper.
Profil 7: BSc i farmaci + Sekvensdata og bioinformatik + ML/AI eller Open Data & FAIR
Bachelorer i facmaci har indgående kendstab til lægemidler og samspillet mellem biologi og kemi. En kombination med domænekurset i Sekvensdata og bioinformatik vil give en data steward-profil, der med dyb faglig indsigt kan arbejde med datagenerering og - håndtering inden for bioinformatikken. I kombination med metodekurset i ML/AI vil data steward-profilen også få indgående kendskab til gængse analyseteknikker og vil kunne bidrage til at data opsamles, renses og forberedes bedst muligt til videre analyse. Alternativt vil en kombination med metodekurset i Open Data og FAIR give en profil, hvor der kan arbejdes indgående med datakvalitet, tilgængelighed, genbrugelighed og interoperabilitet inden for forskning og udvikling.
Uddannelsens kernefaglighed ligger inden for det naturvidenskabelige hovedområde og har til formål at give de studerende en data steward-faglighed, der bygger oven på deres bachelorfaglighed. Den digitale og teknologiske udviklingen går stærkt, og der vil løbende være behov for at investere i hardware og software, herunder licenser, for at kunne tilbyde de studerende en uddannelse, der til hver en tid er up-to-date med udviklingen. Der søges derfor om takst 3 til uddannelsen.
Data er blevet et centralt værdiskabende element i samfundet og ikke mindst derfor er det nationale og regionale behov for data og IT-specialister kraftigt voksende, og udbuddet kan reelt ikke følge med efterspørgslen. Som den nyeste af mange enslydende analyser vurderes det af Danske Gymnasier og IDA (”Mismatch på arbejdsmarkedet for it-uddannede i 2030”, 2021), at manglen på IT-specialister kan komme helt op til 22.000 i 2030.
Den foreslåede data steward-kompetenceprofil er unik i det danske og nordiske uddannelseslandskab og bidrager til uddannelse af dataspecialister i forlængelse af eksisterende (ikke nødvendigvis IT-tekniske) bachorlorfaglighed. Data steward-uddannelsen kan sikre, at relevante dataopgaver, såvel tekniske som fagspecifikke og governancemæssige, håndteres med en relevant tværfaglighed og dermed frigiver ressourcer hos IT-specialister til deres kerneopgaver inden for fx softwareudvikling, machine learning og kunstig intelligens.
KU’s vedhæftede brede behovsundersøgelse, der blev gennemført tidligt i uddannelsens udviklingsproces, viser at 84 % (= 115 personer) af respondenterne vurderer, at data steward-dimittender helt eller delvist er relevante for deres virksomhed/organisation. Respondenterne repræsenterer 10 brancher på ledelses- eller specialistniveau på tværs af hele landet. Undersøgelsens anden runde, baseret på en fokuseret aftagerdialog mod slutningen af uddannelsens udviklingsproces, dokumenterer, at virksomheder som Novo Nordisk, Leo Pharma, Grundfos, Arla Foods, Det Danske Filminstitut og Danmarks Statistik alle er interesseret i at ansætte data steward-dimittender. De vurderer tilsammen, at de alene vil få brug for 150-200 data stewards over de næste fem år.
Ovenstående er uddybet og dokumenteret i den vedhæftede behovsundersøgelse.
I forlængelse af ovenstående kernebehov vurderede 84 % af respondenterne i den brede aftagerhøring, at data steward-uddannelsen kunne være relevant som efter- og videreuddannelse (EVU) for dele af deres kollegaer. En stor interesse for et kompetenceområde inden for EVU indikerer oftest et reelt kompetencegab, der på kort sigt ønskes dækkes via EVU, men hvor en mere permanent løsning bør søges via det ordinære uddannelsesudbud. Dette blev underbygget kvalitativt i begge runder aftagerhøringer. I praksis vil uddannelsens elementer kunne tages som EVU via enkeltfagsordningen.
I forhold til uddannelsens sprog viser begge runder aftagerhøringer, at behovet for data steward-kompetenceprofilen er reelt både i dansksprogede og i engelsksprogede brancher på det danske arbejdsmarked. Dette skyldes, at uddannelsens grundide er at gøre de studerende til data stewards inden for deres bachelorfaglighed. Afhængig af branche vil arbejdssproget være dansk eller engelsk. I uddannelsen er der taget højde for dette, idet der indgår fagelementer, der er forankret i fagområder med enten en dansk- eller engelsksproget begrebsverden. På denne måde vil dimittenderne blive klædt på til at arbejde som data stewards i virksomheder og organisationer, uanset om arbejdssproget er dansk eller engelsk. Uddannelsen udbydes derfor på dansk, men hvor dele af uddannelsen vil blive undervist på engelsk.
KU vurderer konservativt, at der er et årligt behov på mindst 50 data steward-dimittender på det danske arbejdsmarked. Dette antal baseres dels på den generelt stigende efterspørgsel på digitale og specielt data-kompetencer frem mod 2030 på ca. 20.000 dimittender, jf. bilag 1, afsnit 2.1, dels på de konkrete tilkendegivelser fra fem centrale aftagere fra den fokuserede aftagerdialog, Novo Nordisk, Leo Pharma, Grundfos, Arla Foods og Danmarks Statistik, som tilsammen vurderer, at de alene vil få brug for 150-200 data stewards hen over de næste fem år. Suppleres dette udgangspunkt med den brede aftagerhøring, hvor 84 % af respondenterne (= 115 personer) fra danske virksomheder og organisationer vurderer, at data steward-kompetenceprofilen er relevant for deres virksomhed, skønnes det, at det reelle behov for dimittender kan være 100-200 årligt, når kendskabet til kompetenceprofilen udbredes.
KU indstiller derfor, at der indledningsvis optages 50 på data steward-uddannelsen per år, men samtidig at optaget justeres, når der tegner sig et tydeligt billede af interesse fra såvel ansøgere som aftagere. Da data steward-uddannelsen er etårig, kan udbud og efterspørgsel justeres dynamisk.
Indledningsvist blev uddannelsen præsenteret for Aftagerpanel for Matematik og Datalogi samt SCIENCE Digitaliseringsråd. Dernæst er der gennemført en bred aftagerhøring fulgt af en fokuseret aftagerdialog.
Den brede aftagerhøring blev sendt til 470 medlemmer af KU’s 39 aftagerpaneler, hvoraf 33 % svarede. Høringen blev gennemført i februar/marts 2020 og indeholdt både kvantitative og kvalitative spørgsmål. Som baggrundsmateriale fik aftagerne tilsendt en kort beskrivelse af uddannelse baseret på det foreløbige udviklingsarbejde.
På baggrund af den skriftlige feedback fra den brede aftagerhøring blev uddannelsen videreudviklet. Herefter blev 10 aftagere inviteret til yderligere dialog og feedback. I praksis enten gennem et telefoninterview eller skriftlig feedback på baggrund af en detaljeret uddannelsesbeskrivelse.
Respondenterne udgøres af medarbejdere med høj faglig ekspertise, specialisering og indsigt inden for det sundhedsfaglige område, uddannelse/forskning, offentlig forvaltning, finans/jura, it, HR/kommunikation/rådgivning, landbrug/fødevarer, kultur, industri m.fl. og er således kvalificerede til at vurdere behovet på deres arbejdspladser og på det danske arbejdsmarked.
Uddannelsen er fra starten udviklet i samarbejde med aftagere og interesseorganisationer som eksempelvis DeiC [6] og Digitaliseringsrådet ved SCIENCE. Potentielle aftagere har gennem dialog og den brede aftagerhøring bidraget med væsentlige forslag til uddannelsens faglighed og sammensætning. Specielt er ideen om profiler på baggrund af adgangsgivende bacheloruddannelse og domæne- og metodespecifikke kurser udviklet i forlængelse af den brede aftagerhøring og sidenhen bekræftet via den afsluttende aftagerdialog.
Vægtningen mellem og indholdet i uddannelsens obligatoriske elementer er justeret løbende på baggrund af tilbagemeldinger. Flere af uddannelsens valgfrie elementer er inspireret af forslag fra aftagere. Endelig stod det på baggrund af begge høringer klart, at uddannelsens afsluttende projekt bør indeholde et væsentligt element af praksisnær (og domænespecifik) opgaveløsning; som minimum gerne i samarbejde med en virksomhed og hvor muligt som et praktiklignende ophold.
Slutteligt viser tilbagemeldingerne, at der allerede findes og fremadrettet vil opstå mange relevante specialiseringer/profiler, der kan indarbejdes i uddannelsens valgfrihed løbende og efter behov.
Uddannelsen i data stewardship er unik i Danmark og i resten af Norden i kraft af sit indhold og ved at være en etårig uddannelse på kandidatniveau.
Uddannelsen berører dog mange af de samme elementer, som allerede findes på eksisterende uddannelser i datalogi, datavidenskab og kommunikation og IT. Få uddannelser beskæftiger sig dog eksplicit med data stewardship. Spor af data stewardship findes kun i valgfag på en mindre del af uddannelserne, og dermed er det at opnå data stewardship-viden, -færdigheder og -kompetencer ikke en obligatorisk del af nogen eksisterende uddannelse. Se oversigten nedenfor.
Data steward-uddannelsen har sin styrke i, at studerende får procesforståelse, tekniske færdigheder og ekspertise i data forvaltning, management og optimering samt datasikkerhed. Den vigtige kombination af data og jura, som savnes på flere af uddannelser, er et krav for at kunne arbejde med data i et individuelt, lokalt, nationalt og globalt perspektiv. Dermed er data steward-dimittender i stand til at supportere dimittender fra beslægtede uddannelser og give dem plads til at blive bedre til deres kerneområder og udvikle deres faglighed, når de kommer ud på arbejdsmarkedet.
Kandidat- |
1 | 2 | 3 | 4 | 5 | 6 |
Data stewardship (KU) | +++ | +++ | +++ | +++ | +++ | +++ |
Business Analytics (DTU) | +++ | - | - | +++ | +++ | - |
Business Administration and Data Science (CBS) | +++ | +++ | +++ | + | ++ | - |
Datalogi (AAU, AU, ITU, KU, SDU) | +++ | + (AAU) | +++ | ++ | ++ | + (ITU, KU) |
Data Science (ITU, SDU) | +++ | ++ | +++ | +++ | ++ | + (valgfag ITU) |
Informatik (AAU)
|
+ | + | - | - | +++ | - |
Informations- |
+ | - | - | ++ | +++ | - |
Informations- |
- | - | - | ++ | ++ | - |
Informations- |
++ | - | - | - | +++ | - |
Informations- |
+++ | + | +++ | +++ | + | - |
IT & ledelse (AAU) | + | ++ | - | ++ | ++ | - |
IT & kognition (KU) | +++ | - | +++ | ++ | ++ | - |
Kommunikations- |
++ | - | ++ | - | +++ | - |
Kommunikation & IT (KU) | ++ | + | - | + | +++ | - |
Matematisk modellering & computing (DTU) | +++ | - | +++ | +++ | + | - |
Software design (ITU) | +++ | + (valgfag) | ++ | ++ | + (valgfag) | - |
Social Data Science (KU) | +++ | +++ | ++ | ++ | +++ | - |
1. Dataanalyse & -processer (progammering, computational thinking, machine learning & data science)
2. Data Goverance (jura & etik)
3. Data modellering, management & sikkerhed
4. Domænespecifikke kompetencer (data typer, opbygning og brug af data)
5. Formidling & projektledelse
6. Data Stewardship
Oversigten illustrerer, i hvilket omfang de elementer, som data steward-uddannelsen indeholder, er til stede i beslægtede uddannelser.
+++ = meget
++ = middel
+ = lidt
- = intet
Uddannelsen er et tværgående uddannelsestilbud til alle med en akademisk bachelorgrad, der ikke ønsker at fortsætte på en toårig kandidatuddannelse enten direkte efter opnået bachelorgrad eller efter nogle år på arbejdsmarkedet. Uddannelsen henvender sig til bachelordimittender, der ønsker at give deres bachelorfaglighed en digital overbygning enten for at udvide muligheder for at komme i job eller for at kunne søge mod nye, digitale jobfunktioner uden at skulle uddanne sig forfra og/eller give afkald på deres bachelorfaglighed.
KU forventer, at såvel bachelordimittender som aftagere vil tage positivt imod uddannelsen og de muligheder, som den skaber for begge parter.
Endelig vurderer KU også, at kandidatdimittender, der har haft svært ved at komme i job, kan gøre brug af uddannelsen som EVU-mulighed for at udbygge deres kompetencer og dermed opnå en nemmere adgang til arbejdsmarkedet.
Uddannelsen forventes kun i begrænset omfang at være attraktiv for bachelordimittender inden for datalogi, datavidenskab og it og vurderes derfor ikke at mindske tilgangen til de tilsvarende kandidatuddannelser med høj efterspørgsel og lav ledighed.
Ikke relevant.
50 studerende årligt.
Ikke relevant
KU modtog i december 2019 midler af UFM til udvikling af denne uddannelse.