Mange organisationer befinder sig i en situation, hvor deres dataplatform ikke længere afspejler forretningens behov. Nye systemer, stigende datamængder og øgede krav til hastighed og fleksibilitet udfordrer traditionelle arkitekturer – særligt når centrale systemer som SAP bliver omdrejningspunkt for kritiske data.
Spørgsmålet er derfor ikke længere, om dataplatformen skal moderniseres, men hvordan den designes rigtigt fra starten. Det handler om at skabe en platform, der både understøtter drift, analyse og fremtidige AI-initiativer – uden at kompromittere skalerbarhed eller governance.
Tre principper for en fremtidssikret dataplatform
Når organisationer lykkes med at modernisere deres dataplatform, er det sjældent tilfældigt. Det bygger typisk på nogle klare arkitekturprincipper.
Skalerbarhed er fundamentet. Datamængder og brugere vokser kontinuerligt, og platformen skal kunne følge med uden at kræve redesign. Det kræver en arkitektur, der er bygget til horisontal skalering, hvor kapacitet udvides løbende frem for at optimere på en fast struktur.
Automatisering er det næste afgørende element. Mange organisationer bruger stadig uforholdsmæssig meget tid på manuelle processer – onboarding af data, vedligeholdelse af pipelines og fejlretning. En moderne dataplatform bør være metadata-drevet og automatiseret i en grad, hvor data engineers kan fokusere på logik og værdiskabelse frem for drift.
Fleksibilitet binder det hele sammen. Teknologilandskabet ændrer sig hurtigt, og platformen skal kunne tilpasses uden at blive genopbygget. En modulær tilgang gør det muligt at udskifte komponenter – eksempelvis ingestion eller transformationsværktøjer – uden at påvirke resten af løsningen.
Fra rå data til beslutningsgrundlag
En central disciplin i moderne dataplatforme er strukturen i dataflowet. Her ser vi en bevægelse væk fra monolitiske data warehouses og over mod lagdelte arkitekturer.
Typisk organiseres data i tre lag:
Denne tilgang – ofte kendt som medallion-arkitektur – skaber transparens og sporbarhed. Samtidig muliggør den, at data kan genbehandles og genanvendes uden afhængighed af kildesystemerne.
Det er også her, fundamentet for tillid til data skabes. Hvis kvalitet og struktur håndteres systematisk tidligt i pipeline-flowet, bliver det langt lettere at levere stabile og troværdige datasæt til forretningen.
Hvor skal logikken leve?
Et tilbagevendende spørgsmål i designet af dataplatforme er placeringen af forretningslogik. Skal den ligge tæt på kilden – eksempelvis i SAP – eller centralt i dataplatformen?
I praksis ser vi, at de mest robuste løsninger samler størstedelen af transformationerne i dataplatformen. Det giver bedre transparens, gør det lettere at kombinere data fra flere kilder og reducerer afhængigheden af specifikke systemer.
Samtidig er der behov for pragmatisme. I nogle tilfælde giver det mening at lade specifik logik blive i kildesystemet – særligt hvis der er tale om meget komplekse relationer eller datamodeller, som ikke skaber værdi andre steder. Den rette løsning er derfor sjældent et enten/eller, men en balanceret tilgang.
Automatisering som skaleringsmotor
En af de største forskelle mellem traditionelle og moderne dataplatforme er graden af automatisering.
Metadata-drevne pipelines gør det muligt at onboarde nye datakilder uden manuel konfiguration. Kvalitetsregler kan implementeres centralt, og fejl kan håndteres struktureret – eksempelvis ved at isolere problematiske datapunkter uden at stoppe hele dataflowet.
Samtidig åbner moderne teknologier for en glidende overgang mellem batch og streaming. Det betyder, at organisationer kan starte med klassiske opdateringsfrekvenser og gradvist bevæge sig mod near real-time use cases, uden at arkitekturen skal laves om.
Det er en afgørende egenskab i en virkelighed, hvor kravene til aktualitet hele tiden stiger.
Case: Søstrene Grene – fra klassisk BI til moderne dataplatform
Søstrene Grene er et godt eksempel på, hvordan disse principper omsættes i praksis.
Med en ambitiøs vækststrategi, ekspansion til nye markeder og implementeringen af SAP S/4HANA stod organisationen over for markant øgede krav til deres dataplatform. Den eksisterende løsning var ikke designet til hyppige opdateringer eller til at håndtere SAP som central datakilde.
Beslutningen blev derfor at designe en ny platform fra bunden med fokus på skalerbarhed, automatisering og fleksibilitet. Databricks blev valgt som fundament, mens SAP Datasphere blev anvendt til at håndtere dataudtræk.
Arkitekturen blev opbygget efter en klassisk lagdelt tilgang, hvor data bevæger sig fra rå ingestion til standardisering og videre til forretningsmodeller. Samtidig blev en høj grad af automatisering implementeret, så onboarding af nye datakilder i vid udstrækning sker uden manuel indgriben.
En vigtig erfaring i projektet var at fokusere på kompetencer frem for systemer. I stedet for at opbygge dyb SAP-backend viden valgte teamet at styrke deres kompetencer inden for Databricks, SQL og Python og samarbejde tæt med IT om SAP-specifikke elementer.
Derudover arbejdede de konsekvent med MVP-tilgange, hvor løsninger blev leveret iterativt frem for at vente på den perfekte løsning. Det sikrede både fremdrift og hurtig værdiskabelse for forretningen.
Et fundament for AI og fremtidige use cases
En moderne dataplatform er ikke kun et BI-fundament. Den er i stigende grad en forudsætning for at arbejde med avanceret analyse og AI.
Når data er tilgængelig, kvalitetssikret og organiseret, bliver det muligt at stille den til rådighed for data science-teams og nye use cases. Samtidig gør platforme som Databricks det muligt at arbejde i samme miljø på tværs af data engineering, analyse og machine learning.
Det betyder, at investeringen i en ny dataplatform ikke kun løser et aktuelt behov – den åbner også for helt nye muligheder.
Afsluttende perspektiv
Modernisering af dataplatformen er en strategisk disciplin. Det handler ikke om at implementere den nyeste teknologi, men om at etablere et robust fundament, der kan udvikle sig sammen med forretningen.
Organisationer, der lykkes, har typisk en klar arkitektur, et stærkt fokus på automatisering og en pragmatisk tilgang til teknologi og samarbejde.
Resultatet er ikke bare bedre rapportering – men en platform, der gør data til en reel drivkraft for beslutninger, innovation og vækst.