09. september 2015

Big data til gavn for vækst og velfærd – en unik dansk mulighed

Kronik bragt i Berlingske den 9. september 2015 i anledning af konference om Big Data.

Af Troels Østergaard Sørensen, dekan, Det Samfundsvidenskabelige Fakultet, Københavns Universitet, Jørgen Elmeskov, rigsstatistiker, Danmarks Statistik, Adam Lebech, branchedirektør, DI ITEK.

Troels Østergaard SørensenJørgen ElmeskovAdam Lebech

Vi er midt i en vidensmæssig revolution, og Danmark har unikke muligheder. Omvæltningen hedder big data – gigantiske datamængder, der i dag giver os adgang til typer af information og viden, vi for få år siden ikke drømte om. Og med et bedre samarbejde mellem virksomheder, statistikere og forskere har Danmark en unik mulighed for at blive førende i forskning og innovation i big data – hvis vi vil.

Vestas har forstået det. Vindmølleproducenten bruger millioner af vind- og vejr-data fra alverdens målestationer til at beregne, hvor det er bedst at sætte vindmøller op, og præcis hvordan de skal konstrueres for at modstå storme og udnytte vindens energi bedst muligt.

Og Coop har forstået det. Supermarkedskæden bruger kundedata fra mere end en million kundekort til at beregne, hvilke varer, der sælger bedst, hvor og til hvilke typer af kunder. Og de bruger informationerne, når butikkerne skal beslutte, hvornår de kan sætte priser op eller ned på babybleer, vaniljeis og olivenolie.

Big data er, som navnet siger, enorme mængder af data, som man først de senere år er blevet i stand til at indsamle og bearbejde, og for Danmark udgør big data en helt særlig mulighed. Kombinationen af en befolkning, der befinder sig helt fremme i feltet, hvad angår brug af internet og sociale medier til både informationssøgning, handel, social kommunikation og kontakt med det offentlige, og de unikke danske dataregistre, der allerede findes, gør os i særlig grad klar til at høste fordelene i den nye data-drevne udvikling.

Registrene findes i Danmarks Statistik og anvendes til hurtigt, billigt og effektivt at lave statistik. De står også til rådighed for danske forskere, der i mange år har været verdensmestre i registerbaseret forskning. Og så bruges de i stigende grad af ministerier, styrelser og kommuner til planlægning af og opfølgning på den førte politik.

Det interessante spørgsmål er, hvad der skal til, for at vi alle kan få glæde af big data, for der er et enormt potentiale i at udnytte den viden, der ligger i de store mænger data, både i forsknings- og forretningsøjemed. Men det er stadig et mindretal af danske virksomheder, der bruger big data, og samarbejdet mellem forskning og erhvervsliv skal intensiveres, for det er det samarbejde, der er nøglen til at få koblet de enorme private datamængder til de store registerdatabaser.

Fra borger- og forbrugerperspektivet betyder den øgede anvendelse af data, at sikkerheds- og privacy-spørgsmål bliver vigtigere end nogensinde. Den digitale tillid er fundamentet for at kunne udnytte mulighederne, og dataforskrækkelse må ikke hindre danske virksomheders mulighed for at få glæde af den unikke danske position.

Det er nu, vi skal tage det næste skridt for at udnytte Danmarks helt særlige muligheder for at blive førende i forskning i og brugen af big data, og det er afgørende at få hul på dialogen om, hvordan forskere og virksomheder kan arbejde sammen om big data, samtidig med at borgernes privatliv beskyttes. Det er baggrunden for den konference som Københavns Universitets Samfundsvidenskabelige Fakultet, Danmarks Statistik og Dansk Industri holder om big data i denne uge.

Data til lands, til vands og i luften

Big data kommer fra computerstyret produktion, sensorer, sociale medier, butikkernes kunder, trafik på hjemmesider, trafik til lands, vands og i luften, GPS´er, tekstfiler fra internettet, digitale kameraer – fra alt det, mennesker foretager sig, hvor noget digitalt er involveret. En udvikling, der gør det muligt at samle, analysere, sammenligne og udnytte store mængder af data fra mange forskellige datakilder.

Virksomhederne bruger big data, når de vil forstå kundernes ønsker og behov. Statistikbureauer i hele verden prøver kræfter med mulighederne i big data. Den offentlige sektor kan udvikles ved hjælp af big data. Og forskningsverdenen er i fuld fart på vej ind i en revolution, der kan løfte vores fælles vidensgrundlag til nye højder.

Silkeborg er en af de få danske kommuner, der for alvor har fået øjnene op for potentialet i big data. Sammen med firmaet Dataproces har kommunen systematiseret sine udbetalinger og opkrævninger af for eksempel pensioner over kommunegrænsen. Tidligere var det en ressourcekrævende manuel øvelse, som var så uoverskuelig, at der skete fejl i millionklassen. Med big data tjente kommunen et tocifret millionbeløb blot ved at gå kommunens digitale procedurer efter.

Også tandplejen i Silkeborg har gavn af kommunens nye fokus på big data. Ved hjælp af BBR-registeret, Gallups livsstilsundersøgelser, sundhedsdata og geodata er kommunen ved at tegne et minutiøst kort over alle husstande ned til 100x100 meter felter. Det giver mulighed for at målrette den forebyggende indsats og placere nye tandlægeklinikker i de områder, hvor flest borgere har dårlige tænder.

Data et offentligt gode

Registerdata er et samfundsmæssigt gode, og forskningen skaber viden til samfundets fælles bedste. En vigtig forudsætning for den danske data-revolution er, at Danmark et af de lande i verden, hvor borgerne har størst tillid til hinanden, til virksomheder og til det offentlige.

Data fra de offentlige registre har været brugt til forskning siden begyndelsen af 1980´erne, og tilliden er grunden til, at forskere kan få adgang til så detaljerede data, som registrene indeholder. Her findes informationer om borgere og virksomheder, der er enestående i international sammenhæng, Registrene er omfattende og rummer oplysninger om vores sundhed, uddannelsesforløb, arbejdsliv og familieforhold, og borgerne ved, at data opbevares betryggende hos Danmarks Statistik.

Med tilsvarende data fra danske virksomheder kan man iagttage borgernes indtjening, ansættelser, energiforbrug og forbrugsmønstre. Alle disse registre kan køres sammen, og det gør Danmark til noget helt særligt. Men når forskere og myndigheder får adgang til registerdata, sker det altid i anonymiseret form, det vil sige, at ingen enkeltperson eller virksomhed kan identificeres. Det er en grundforudsætning for, at den digitale tillid opretholdes.

Til glæde for samfundet

Det var politisk fremsynethed og mod for halvtreds år siden, der sørgede for, at Danmark i dag står i denne særligt gunstige situation. Loven om Danmarks Statistik i 1966 sikrede, at data i de (på det tidspunkt) kommende offentlige registre kunne blive et vigtigt grundlag for produktionen af billig statistik. Data fra registre kunne erstatte dyre spørgeskemaundersøgelser, og de danske registerdata er blevet en guldgrube for forskere og analytikere – en væsentlig sideeffekt, som ingen havde forudset.

De danske registerforskere løftede den samfunds-og sundhedsvidenskabelige forskning op på et helt andet niveau, end man tidligere havde set. For eksempel har nobelpristageren i økonomi i 2010 Dale T. Mortensen i samarbejde med danske forskere og ved hjælp af danske registerdata gennemført en række arbejdsmarkeds-analyser, der viste bevægelser ud og ind af arbejdsløshed. Nu er noget lignede på vej med big data, og Danmark har en række fordele i forhold til andre lande.

Allerede nu kan forskere kombinere big data med andre typer af data, hvilket giver dem helt ny viden og nye muligheder. Som for eksempel i forskningsprojektet Social Fabric, et samarbejde mellem Københavns Universitet og DTU, hvor 1000 studerende har fået udleveret en smartphone til fri brug, mod at forskerne indsamler anonymiserede oplysninger om blandt andet de unges fysiske og sociale færden: Hvem er de venner med, hvem mødes de med, hvem er de i læsegruppe med, kommer de til undervisningen, er de på facebook i timerne og meget andet. Via telefonernes bluetooth kan man endda også se, hvor tæt de fysisk er på hinanden.

Når forskerne kobler disse data fra telefonerne med oplysninger om studielivet, kan de se, hvilken betydning den sociale del af studielivet har for eksempel i forhold til karakterer eller frafald på uddannelsen. Har de studerende, der flittigt møder op til forelæsning og læsegruppe, bedre odds for at gennemføre hele studiet end de, der vælger at læse hjemme på kollegieværelset? Og når forskerne kobler de sociale data til forskningsregistre, kan de se samspillet med elevernes sociale baggrund, sundhed, familieforhold, bopæl og skolegang- alt i anonymiseret form, så ingen enkeltpersoner kan identificeres.

Systematisk tilgang nødvendig

Registerdata har bragt os langt. Nu står vi overfor det næste datamæssige gennembrud: big data, og igen er der brug for politisk fremsynethed. For selvom der allerede findes en række eksempler på, hvordan big data bruges af virksomheder, forskere og statistikere til at øge vores viden om samfundet, så er der brug for en mere systematisk indsats, hvis Danmark skal bringe sig lige så langt i front i brugen af big data, som det er tilfældet med registerdata.

Det skal gøres nemt for forskere og virksomheder at samarbejde, og det skal sikres fra politisk hånd, at vi uddanner og kan tiltrække de rette talenter til at arbejde med data.

Den indsats begynder med en dialog mellem de virksomheder, der producerer big data, dem der gerne vil bruge big data til samfundsmæssig analyse og forskning, og de politikere og ledere, der kan anvende den nye viden, der skabes med big data. Det er den dialog, vi nu tager hul på med vores fælles konference.