Alati za profilisanje podataka

Prilikom uvoza tabela sa nekog od izvora postoji mogućnost greške ili uvoza praznih vrednosti. Isto tako, u cilju optimizacije modela, često se ukazuje potreba za uvidom u strukturu podataka prema kolonama. Jedan način da ovo postignemo je filtriranje tabele i pregled vrednosti filtera. Može da posluži! Ipak, Power Query poseduje ugrađene alate koji nam omogućavaju da na lak način pregledamo statistike podataka…

Otvorite Power Query Editor, pa izaberite ribon View.  Videćete da je u njemu već selektovana opcija Show Whitespace. Ona služi za automatsku primenu escape sekvenci koje se eventualno nalaze u tekstu. To znači npr. da, ako postoji sekvenca za prelom reda, možete da vidite sadržaj u dva reda. Izborno polje Monospaced omogućava promenu fonta kojim se prikazuju podaci u Monospace.

Opcija Column quality služi za prikaz validnih vrednosti, praznih i vrednosti sa greškom. Istovremeno, ona boji podnožje zaglavlja kolone tako da na osnovu boje možemo brzo da zaključimo da li je potrebno da ulazimo u detaljniju analizu. Pored vrednosti Valid, Error i Empty može imati i vrednost Unexpected Error (isprekidana crvena linija) ili Unknown kada je kvalitet kolone nepoznat, a ona verovatno poseduje greške (isprekidana zelena linija).

Column distribution prikazuje grafikon distribucije vrednosti. Takođe, omogućava da vidimo jedinstvene (Distinct) vrednosti ili one koje se samo jedanput pojavljuju (Unique).

Opcija Column Profile pored grafikona distribucije prikazuje i mnoštvo dodatnih statistika za uvid u vrednosti kolone.