Nedenfor kan du downloade hele artiklen:
Data Science
En guide til kunstig intelligens og machine learning
Data Science
Big data-revolutionen har efterhånden raset i nogle år, og alle virksomheder og offentlige institutioner har mere eller mindre færdige datavarehuse. Men hvorfor? Vi har fået bedre rapportering og bedre indsigt i de daglige operationer. Mere ledelsesrapportering og flere dashboards. Alt det er sådan set værdifuldt, men der kan opnås langt mere værdi.
Data science lover at bringe operationelle løsninger og endnu dybere indsigt til organisationer. Særligt for data science er ønsket om at udvikle løsninger, som kommer med råd i konkrete operationelle situationer, eller fuldt automatisere et skridt i en arbejdsproces. Det er ikke det eneste, det kan, men det er et af de helt store fokuspunkter.
Data science er en disciplin, der samler statistik, dataanalyse og machine learnings fælles metoder i forsøget på at undersøge og analysere virkelige fænomener via data
Et eksempel kunne fx være en læge. En patient kommer ind af døren, og en data science- løsning præsenterer ikke bare et dashboard baseret på patientens journal, men også et sæt af forudsagte opmærksomhedspunkter for lægen baseret på patientens historik, den nyeste forskning og det nuværende sygdomslandskab i verden.
Patienten får foretaget et scan af sine lunger, som giver besvær, og da scanneren afleverer billedet, foreslår den straks, at en region af billedet undersøges nærmere for potentielle kræftknuder og fremhæver straks området. Maskinen er trænet på millioner af billeder verden over, og lægen er straks mere opmærksom.
Efter patienten er gået, dikterer lægen et notat, som automatisk gemmes som tekst. En algoritme bemærker, at der nævnes et scan af lungerne og tilføjer automatisk en procedure-kode på patientens historik. Det bemærkes desuden, at der er mistanke om kræft, og et opmærksomhedsflag rejses på patienten til fremtiden.
I eksemplet ovenfor blev data science først brugt til at give en bruger overblik ud fra et ellers uoverskueligt informationsgrundlag. Herefter blev der ydet beslutningsstøtte, og et område blev fremhævet. Endelig var der til sidst en fuldautomatisering af journaliseringen af arbejdet.
Vi er næppe helt dér endnu. Men vi er uden tvivl på vej, og i denne guide vil det give indtryk af, hvordan du kan efterprøve og styre data science-eksperimenter i din organisation.
Denne guide er først og fremmest til folk, der vil i gang med at øge data science- kompetencerne i deres organisation. Enten dem selv ved at blive bedre data scientist- eller softwareudviklere eller ved at lede en større eller mindre data science-afdeling. Denne guide giver et dybt indblik i et komplet data science workflow – ikke bare fra data til model, men fra identifikation af det rette problem til opsætning af modellen og til realisering af værdien og vedligeholdelse.
Udfordringen er, at selvom mange organisationer ønsker at begynde med kunstig intelligens, og en del endda forsøger, så møder de systematisk nogle udfordringer, som vi gerne vil forsøge at præsentere en moderne løsning på.
Vi oplever i Implement en stor efterspørgsel på data science-kompetencer. Det skyldes primært, at mange organisationer sidder inde med store – og hastigt voksende – mængder af data. Det rejser mange steder det naturlige spørgsmål: Kan al den data ikke bringes i spil og skabe forretningsværdi på en eller anden måde?
Det næste, der oftest sker, er, at man finder en medarbejder, som sættes i gang. Enten med at identificere en anvendelse eller blive givet en konkret opgave, som skal løses med en data science-løsning.
Udfordringen er, at en dygtig data scientist har tre kompetencer, der er yderst sjældne sammen:
Hvis et af disse elementer mangler, møder data scientisten ofte udfordringer:
Ikke overraskende er netop udfordringer med at afslutte projekter, opnå den forventede kvalitet og faktisk opleve den ønskede effekt nogle af de mest udbredte problemer i nye data scienceprojekter.
I denne guide vil du blive taget med på rejsen fra den tidligste start med use case- identifikationen og helt til råd om governance af modeller, når de er lagt ud til anvendelse. Guiden består af syv kapitler med følgende overskrifter: