Artikel

Data Science 2023

Data science i en tidsalder med kunstig intelligens

Authors

Hvad er data science?

Big data-revolutionen har efterhånden raset i nogle år, og de fleste virksomheder og offentlige institutioner har færdige datavarehuse eller data lakes, hvor organisationens data samles. Det har givet os bedre rapportering og mere indsigt i de daglige operationer. Mere ledelsesrapportering og flere dashboards. Alt det er sådan set værdifuldt, men der kan opnås langt mere værdi, hvis vi tager skridtet videre.

Data science lover at bringe operationelle løsninger og endnu dybere indsigt til organisationer. Særligt for data science er ønsket om at udvikle løsninger, som kommer med råd i konkrete operationelle situationer eller fuldt automatiserer et skridt i en arbejdsproces. Det er ikke det eneste, det kan, men det er et af de helt store fokuspunkter.

Data science samler statistik, machine learning og videnskabelige metoder til at skabe indsigter om virkeligheden fra struktureret og ustruktureret data.

Et eksempel kunne fx være en læge. En patient kommer ind ad døren, og en data science- løsning præsenterer ikke bare et dashboard baseret på patientens journal, men også et sæt forudsagte opmærksomhedspunkter for lægen baseret på patientens historik, den nyeste forskning og det nuværende sygdomslandskab i verden.

Patienten får foretaget en scanning af sine lunger, og da scanneren afleverer billedet, foreslår den straks, at et område af billedet undersøges nærmere for potentielle kræftknuder og fremhæver området. Maskinen er trænet på millioner af billeder verden over, og lægen er mere opmærksom.

Efter patienten er gået, dikterer lægen et notat, som automatisk gemmes som tekst. En algoritme bemærker, at der nævnes en scanning af lungerne, og tilføjer automatisk en procedurekode på patientens historik. Det bemærkes desuden, at der er mistanke om kræft, og et opmærksomhedsflag rejses på patienten til fremtiden.

I eksemplet ovenfor blev data science først brugt til at give en bruger overblik ud fra et ellers uoverskueligt informationsgrundlag. Herefter blev der ydet beslutningsstøtte, og et område blev fremhævet. Endelig var der til sidst en fuldautomatisering af journaliseringen af arbejdet. I dette tilfælde gør det, at lægen kan levere en højere præcision i sit arbejde (bedre diagnoser), bruge mere tid på patientkontakt (bedre kvalitet) og har tid til at se flere patienter på en dag (mere effektivitet).

Vi er næppe helt dér endnu. Men vi er uden tvivl på vej, og i denne guide vil vi give indtryk af, hvordan du kan efterprøve og styre data scienceeksperimenter i din organisation.

Brochure

Download hele artiklen

Download hele guiden om Data Science 2023 (36 sider). Her kan du læse mere om, hvordan data science fungerer i dagens organisationer, og hvordan du kommer i gang med at bruge data science i din egen organisation.

Få din udgave her
Hvem er denne guide til?

Denne guide er først og fremmest til folk, der vil i gang med at øge data science- kompetencerne i deres organisation. Enten dem selv ved at blive bedre data scientists eller softwareudviklere eller ved at lede en større eller mindre data science-afdeling. Denne guide giver et dybt indblik i et komplet data science-workflow – ikke bare fra data til model, men fra identifikation af det rette problem til opsætning af modellen og til realisering af værdien og vedligeholdelse.

Som sådan er den også relevant for ledere inden for dataanvendelse og digitalisering. Data science er et område i hastig udvikling, og det kan være en fuldtidsbeskæftigelse bare at følge med i, hvad der kan lade sig gøre. Vi vil her forsøge at bidrage til at give indblik i, hvad der kan forventes af moderne data science-løsninger, og hvad det kræver at opnå succes med dem.

Hvorfor denne guide?

Vi oplever i Implement en stor efterspørgsel efter data science-kompetencer. Det skyldes primært, at mange organisationer sidder inde med store – og hastigt voksende – mængder af data. Det rejser mange steder det naturlige spørgsmål: Kan al det data ikke bringes i spil og skabe forretningsværdi på en eller anden måde?

Det næste, der ofte sker, er, at der enten findes et forretningsproblem, som det besluttes skal løses med den første data science-løsning, eller måske en entreprenant medarbejder beslutter sig for at foreslå udviklingen af en konkret løsning. I nogle tilfælde nedsættes et team, som begynder noget løsningsidentifikation.

Kerneudfordringen er, at under alle omstændigheder er der behov for at have tre kompetencer til stede i processen: (1) Softwareudvikling og it, (2) Statistik og machine learning og (3) Forretningen eller det domæne, de arbejder indenfor.

Hvis et af disse elementer mangler, møder data science-projektet ofte udfordringer:

  • Mangler softwareudvikler/it, risikerer projektet at blive en fantastisk løsning, som dog ikke kan implementeres i forretningen og er et sted imellem vanskelig og umulig at vedligeholde. Løsningen vil måske aldrig komme ud og skabe værdi, og hvis den gør, så har den et kort liv.
  • Mangler statistik- og machine learning-kompetencerne, vil projektet ofte have svært ved at levere den tilstrækkelige kvalitet af løsninger, som der efterspørges. Projektet forbliver afskåret fra at takle de nye og svære problemer, som de potentielt kunne, hvis de havde en større forståelse for machine learning.
  • Mangler forretningsforståelsen, risikerer vedkommende at udvikle flotte løsninger, der ikke finder anvendelse i forretningen, og hvor gevinsterne ved udviklingen aldrig realiseres.

Ikke overraskende er netop udfordringer med at afslutte projekter, opnå den forventede kvalitet og faktisk opleve den ønskede effekt nogle af de mest udbredte problemer i nye data science-projekter.

Denne guides indhold

I denne guide vil du blive taget med på rejsen fra den tidligste start med use case- identifikationen og til råd om governance af modeller, når de er lagt ud til anvendelse. Guiden består af otte kapitler med følgende overskrifter:

  • Kapitel 1. Use case-identifikation: Hvordan sikrer du, at du arbejder på en værdifuld idé?
  • Kapitel 2. Dataeksploration: Få overblik over dine data, ikke bare mønstre og indhold, men skabelsen og håndteringen.
  • Kapitel 3. Machine learning: Hvad er de statistiske teknikker, vi bruger til at lave vores analyser? Hvordan rammer du den rigtige mængde kompleksitet og sikrer, at din model virker i virkeligheden?
  • Kapitel 4. Definition af formål: Hvad skal din model optimere for? Hvad er egentlig problemet, vi forsøger at løse? Og hvordan sikrer du, at din model faktisk gør det, du regner med?
  • Kapitel 5. Moderne deep learning og fine tuning: Data science-værktøjskassen vokser – særligt en teknik, hvor store modeller genbruges, og deres egenskaber flyttes fra et domæne til et andet. 
  • Kapitel 6. MLOps og testing: Hvordan får vi sat vores modeller ud i virkeligheden og sikrer, at de skaber værdi i lang tid fremover?
  • Kapitel 7. Etik: Data science berører mange menneskelige aspekter fra persondata til automatisering. Kapitel 5 giver en indflyvning i de vigtigste overvejelser og konkrete råd til, hvordan ting beskyttes. 
  • Kapitel 8. Data science governance: Når modeller skal ud at skabe værdi, skal de styres og vedligeholdes. De skal måske endda opdateres eller i hvert fald overleve, at it-landskabet omkring dem opdateres. Dertil har vi governance.

Guiden her kan med fordel læses kapitel for kapitel, men er også bevidst skrevet, så enkelte kapitler kan læses ude af kontekst. Hvis du blot har brug for at lave et nedslag på et bestemt område, så gå endelig frem til det relevante kapitel.

Download hele artiklen og fordyb dig i status på data science 2023