De belofte en uitdagingen van gegevenswetenschappen

"Ik heb echt genoten van de Data Science Life Cycle-sessie. Het gaf me de kans om vertrouwd te raken met een aantal van de uitdagingen van data science-projecten. Ook werd ik gestimuleerd om op een andere manier naar datadimensies te kijken. Vaak beginnen we naar datasets te kijken met sterke aannames die niet noodzakelijk waar zijn. We kregen krachtige analytische tools aangereikt om deze aannames in twijfel te trekken", zegt Davide Pellegatta (42), woont in Luxemburg en werkt voor Couchbase NoSql database.

 

De sessie Levenscyclus gegevenswetenschapgepresenteerd door Dr. Johan van Soestmaakt deel uit van het keuzevak Digital Management, dat deel uitmaakt van de Digital Business Course. 29 Studenten van alle richtingen, zowel van de Online MBA track als de On-Campus MBA track, werden ondergedompeld in de wereld van data science. Johan van Soest begon met de 'buzz word bingo' en legde de verschillende begrippen en afkortingen in de data science business uit. Hij verduidelijkte ook de verschillende soorten data, hoe deze vast te leggen en te gebruiken en een aantal aspecten van 'big data'.

Over Johan van Soest

Dr. Johan van Soest is assistant professor Translational Data Science bij het Brightlands Institute for Smart Society (BISS). Hij heeft een achtergrond in de medische informatica en is gepromoveerd in Clinical Data Science. Zijn onderzoek concentreert zich op methoden voor informatie-uitwisseling en verantwoorde toepassing van kunstmatige intelligentie in de praktijk. Specifiek richt hij zich op methoden om het data science proces meer bewust te maken van ethische, juridische en maatschappelijke aspecten (ELSA) en deze overwegingen transparant te maken voor potentiële gebruikers van AI. Ten tweede houdt hij zich bezig met de translationele kloof tussen het genereren van data science inzichten en implementatie in de (klinische) praktijk, waarbij hij ingaat op de vraag wat er nodig is om data science inzichten veilig te gebruiken in de (klinische) praktijk.

 

 

CRISP-DM-methode

Data Science en AI houden enorme beloften in om zakelijke besluitvorming te verbeteren door waardevolle inzichten te genereren. Het is echter geen magisch hulpmiddel, zoals Johan aangeeft. Een van de grote uitdagingen is het omgaan met de enorme hoeveelheid gegevens en het organiseren van de datapijplijn van ruwe gegevens naar relevante managementinformatie. De CRISP-DM-methode (Cross-Industry Standard Process for Data Mining) is een veelgebruikte methode. Tijdens de sessie gingen de studenten dieper in op deze methode. CRISP-DM is een procesmatige aanpak die bedrijven helpt bij het definiëren van het probleem, het verzamelen, begrijpen en analyseren van de gegevens die geschikt zijn voor hun doel en het evalueren van de resultaten.

Zes stappen

Stap 1 in de Data Science Life Cycle is business understanding oftewel wat is het probleem dat opgelost moet worden. De tweede stap, het begrijpen van gegevens, gaat over het bekijken van de gegevens, voor welk doel zijn ze oorspronkelijk verzameld, hoe houden ze verband met het bedrijfsprobleem, hoe relevant zijn ze en wat zijn de kosten en baten van het ophalen ervan. Stap 3 is de voorbereiding van de gegevens; ervoor zorgen dat de gegevens correct zijn. De gegevens zijn dan klaar om gemodelleerd te worden (stap 4). In deze stap moet men overwegen welk hulpmiddel het meest geschikt is om de vraag te beantwoorden. De vijfde stap is evaluatie. Zijn de resultaten geldig en betrouwbaar, past het gekozen model bij het oorspronkelijke bedrijfsdoel, hoe goed zijn de voorspellingen? De laatste stap is implementatie; het introduceren en gebruiken van modellen in de praktijk.

De complexiteit overbrengen

Davide: "Als voormalig ontwikkelaar was data science niet nieuw voor me, maar toch ben ik er nooit diep genoeg in gedoken. Daarom is mijn volgende stap om wat tijd aan dit onderwerp te besteden. Voor mij had deze sessie een grote rol in het overbrengen van de complexiteit achter engineeringkeuzes die het management soms ontgaan. Ik heb er echt van genoten."

 

 

Dit artikel geeft de inzichten en ervaringen van studenten weer van de module Digital Management van het keuzevak Digital Business. Het MaastrichtMBA-programma heeft een executive modulaire deeltijdindeling en biedt twee tracks: MBA op campus en Online MBA. Het programma heeft een Triple Crown accreditatie en is bedoeld voor professionals met minimaal 5 jaar werkervaring.