Consultancy
Services
Tech
Microsoft kurser
Hvad er Data Lake?
Har du ligesom mange andre virksomheder også udfordringer med at skabe overblik i dit data, og har du et ønske om at samle alt dit data ét sted for herefter hurtigt at kunne sammenholde det? Så er Microsofts Azure Data Lake lige noget for dig.
Microsofts definition af Data Lake lyder: a centralized repository that ingests, stores, and allows for processing of large volumes of data in its original form. Azure Data Lake samler altså alt data uanset form og størrelse og behandler og analyserer det på tværs af platforme og sprog.
Fordelen ved Datalake er, at du på forhånd ikke behøver nogen klart defineret datamodel, men dataene kan puttes ned i søen i det format, det nu en gang har, og det kan hentes af afdelinger i hele virksomheden.
Data Lake Store - en sø med uendelig plads
Et hurtigt overblik over en stor mængde forskelligt data og nem adgang til flere analyser er essensen i Data Lake. Data Lake består imidlertid af to dele, hvor Data Lake Store opbevarer dataene, og Data Lake Analytics analyserer det.
Data Lake Store kan opbevare alt dit ustrukturerede, delvist ustrukturerede og strukturerede data. Med andre ord kan Data Lake Store opbevare alle typer af data, hvorfor du her får størst mulig værdi ud af alt dit indsamlede data.
Data Lake Store giver dig foruden Data Lake Analytics mulighed for at integrere andre analyseværktøjer såsom Machine Learning, Data Warehouse og Power BI.
Fordelene ved
data lake
- Opbevaring af alle typer data
- Mulighed for brug af velkendte analyseværktøjer
- Behandl data lynhurtigt
- En økonomisk god løsning – tilpasset dine behov
Her ser du eksempler på, hvornår du med fordel kan benytte data lake.
Hvis du:
- Skal analysere på Big Data, som du ikke vil lægge ind i dit data warehouse
- Benytter Machine Learning og dermed har behov for data fra diverse kilder
- Skal stage dine data, inden de skal benyttes af andre i Azure
Data lake vs data warehouse
Tænker du på, om Data Lake og Data Warehouse er det samme? Her er svaret: Det er det ikke!
Flere har tendens til at sammenligne de to platforme, da de begge samler data, men i realiteten er de langt mere forskellige end de er. Blandt andet er dataene i et Data Warehouse udvalgt på baggrund af en velovervejet datamodel, hvorimod dataene i Data Lake indeholder alt data fra hele virksomheden. Data Lake giver dig dermed mulighed for at foretage analyser, som ikke er mulige i et Data Warehouse.
Der er mange forskelle, men de væsentligste relaterer sig til datastruktur, behandlingsmetoder, ideelle brugere og det overordnede formål med dataene alle opsummeret i tabellen herunder.
Consultancy
Services
Tech
Microsoft kurser
Data Lake
Solutions
Som med enhver anden dataløsning findes der mange forskellige Data Lakes på markedet. For eksempel Microsoft Data Lake, Snowflake Cloud Data Platform, Google Data Lake, AWS Data Lake og flere til. Og som med enhver anden løsning er der fordele og ulemper ved dem alle.
Hos Inspari anbefaler vi som udgangspunkt Azure. Fordelen ved Microsofts Azure Data Lake er nemlig, at den bygger på en skalerbar og fleksibel cloud-platform med høje sikkerhedsstandarder. Derudover giver Azure Data Lake dig rig mulighed for at udnytte Microsofts brede økossystem af Azure-tjenester.
Dit valg af Data Lake-løsning afhænger af din virksomheds specifikke behov. Hos Inspari står vi altid klar til at rådgive dig om hvilken Data Lake, der passer til netop din virksomhed.
Data lake analytics analyserer hurtigt
Fordi alt data er samlet i Data Lake Store, kan du med Data Lake Analytics meget hurtigt danne dig et overblik over dine data. Dette gør, at du kan tage hurtigere beslutninger og dermed hurtigere skabe værdi.
Prisen for analysen præger du selv, da du kun betaler for den tid, du bruger. Dette gør Data Lake Analytics til en økonomisk god løsning, da prisen udregnes efter dig og dine behov.