Hvad er data science?
Big data-revolutionen har efterhånden raset i nogle år, og de fleste virksomheder og offentlige institutioner har færdige datavarehuse eller data lakes, hvor organisationens data samles. Det har givet os bedre rapportering og mere indsigt i de daglige operationer. Mere ledelsesrapportering og flere dashboards. Alt det er sådan set værdifuldt, men der kan opnås langt mere værdi, hvis vi tager skridtet videre.
Data science lover at bringe operationelle løsninger og endnu dybere indsigt til organisationer. Særligt for data science er ønsket om at udvikle løsninger, som kommer med råd i konkrete operationelle situationer eller fuldt automatiserer et skridt i en arbejdsproces. Det er ikke det eneste, det kan, men det er et af de helt store fokuspunkter.
Data science samler statistik, machine learning og videnskabelige metoder til at skabe indsigter om virkeligheden fra struktureret og ustruktureret data.
Et eksempel kunne fx være en læge. En patient kommer ind ad døren, og en data science- løsning præsenterer ikke bare et dashboard baseret på patientens journal, men også et sæt forudsagte opmærksomhedspunkter for lægen baseret på patientens historik, den nyeste forskning og det nuværende sygdomslandskab i verden.
Patienten får foretaget en scanning af sine lunger, og da scanneren afleverer billedet, foreslår den straks, at et område af billedet undersøges nærmere for potentielle kræftknuder og fremhæver området. Maskinen er trænet på millioner af billeder verden over, og lægen er mere opmærksom.
Efter patienten er gået, dikterer lægen et notat, som automatisk gemmes som tekst. En algoritme bemærker, at der nævnes en scanning af lungerne, og tilføjer automatisk en procedurekode på patientens historik. Det bemærkes desuden, at der er mistanke om kræft, og et opmærksomhedsflag rejses på patienten til fremtiden.
I eksemplet ovenfor blev data science først brugt til at give en bruger overblik ud fra et ellers uoverskueligt informationsgrundlag. Herefter blev der ydet beslutningsstøtte, og et område blev fremhævet. Endelig var der til sidst en fuldautomatisering af journaliseringen af arbejdet. I dette tilfælde gør det, at lægen kan levere en højere præcision i sit arbejde (bedre diagnoser), bruge mere tid på patientkontakt (bedre kvalitet) og har tid til at se flere patienter på en dag (mere effektivitet).
Vi er næppe helt dér endnu. Men vi er uden tvivl på vej, og i denne guide vil vi give indtryk af, hvordan du kan efterprøve og styre data scienceeksperimenter i din organisation.