Tokovi podataka

Power Query omogućava, bilo da koristite Excel ili Power BI, da se povežete sa brojnim izvorima podataka, izvršite preuzimanje, transformaciju i upotrebite „prečišćene“ podatke radi kreiranja izveštaja. Tom prilikom evidentira se svaki korak u procesu transformacije, a kada osvežite vezu ka izvoru koraci se ponove zadatim redosledom i dobijete tabele identične strukture. Šta nam novo donose tokovi podataka?

Tokovi podataka omogućavaju kreiranje scenarija za preuzimanje i transformaciju podataka bez potrebe za kreiranje više konekcija, a mogu se iskoristiti i u više dataset-ova. Omogućavaju lakši rad sa velikim bazama, sprečavaju direktan pristup analitičara podacima i olakšavaju rad administratorima sistema, posebno prilikom planiranja vremena kada se vrši osvežavanje podataka. Što je najvažnije, „prečišćeni“ podaci ostaju u oblaku, spremni za dalje korišćenje.

Da biste koristili tokove podataka morate da imate Power BI Professional ili Power BI Premium licence. Ne možete ih kreirati u okviru radnog prostora My Workspace već morate da iskoristite neki drugi (postojeći). U ovom primeru koristimo radni prostor koji se zove MyDSC. Radi kreiranja toka podataka otići ćemo u ovaj radni prostor, a zatim iz menija New izabrati opciju za kreiranje novog toka.

Zatim, biramo da li želimo da kreiramo tok podataka na osnovu novog izvora (Define new entities) ili iz postojećeg modela podataka (Import model).

Izborom prve opcije otvoriće se prozor u kome su nam ponuđeni konektori ka raznovrsnim izvorima podataka. Ako se odlučimo za uvoz iz lokalne datoteke ili baze potrebno je da se povežemo pomoću On-premises data gateway-a. Na servise ili baze u oblaku se povezujemo unosom kredencijala, a moguće je čak i ručno uneti tabelu ili napisati upit.

Kada uvezemo podatke možemo da vršimo sve one transformacije koje bi smo inače činili koristeći Power Query.

Ako uđete u View ribon videćete da tamo postoji opcija Diagram View koja je (u trenutku dok ovo probamo) u eksperimentalnoj fazi. Ako je uključite biće prikazan dijagram transformacije podataka i u okviru njega svaka faza transformacije. Show Step Names prikazaće u dijagramu pun naziv koraka, a Show Step Labels skraćene nazive. Opcija Auto-highlight related queries označiće sve povezane upite. Klikom na Save&Close sačuvaćemo sve transformacije u okviru toka podataka i dati mu ime.

Kada smo napravili tok podataka možemo da podesimo i period osvežavanja. Kod Power BI Professional licenci najkraći period osvežavanja je 30 minuta, dok kod Power BI Premium servisa to može da bude i kraće. U momentu osvežavanja tok će se povezati sa izvorima, izvršiti neophodne transformacije i sačuvati podatke. Dalje toku podataka pristupate iz Power BI Desktop aplikacije, gde možete da ga iskoristite kao jedan od izvora te da na osnovu uvezenih podataka pravite izveštaje.