Lakehouse

Lakehouse je jedinstvena arhitektura koja objedinjuje najbolje karakteristike Data Lake repozitorijuma, koji se koristi za čuvanje nestrukturiranih i polu-strukturiranih podataka, kao i skladišta podataka (Data Warehouse) koja se koriste za čuvanje strukturiranih podataka koji služe za kreiranje izveštaja. Odnosno, sve ove podatke možete da čuvate na jednom mestu i pristupite im putem PySpark ili SQL jezika…

Dataflow Gen2

Dataflow je alat koji već jako dugo postoji u Power BI servisu, a koristi se za uvoz, transformaciju i učitavanje podataka u semantički model (ETL). Praktično, to je Power Query u cloud okruženju. Pojavom Microsoft Fabric-a uveden je Dataflow Gen2 koji je dosta napredniji u odnosu na prethodnu verziju i omogućava brži rad sa velikim količinama podataka, kao i njihovu paralelnu obradu.

OneLake katalog

Otkako se Power BI transformisao i postao deo Microsoft Fabric platforme na raspolaganju su nam brojne nove, korisne opcije. OneLake je mesto gde se sada nalaze svi strukturirani, polu-strukturirani i nestrukturirani podaci organizacije, a radi lakšeg pristupa, deljenja i upravljanja čuvaju se u otvorenom Delta Parquet formatu. OneLake katalog je funkcija u okviru Microsoft Fabric-a koja radi kao centralizovano mesto za čuvanje, pronalaženje, analizu podataka…