Integracja danych z różnych źródeł w Power BI
W zależności od etapu dojrzałości firmy czy też przedsiębiorstwa, niezbędne jest wdrożenie narzędzia do przechowywania danych. Najczęstszą motywacją do zaimplementowania bazy jest potrzeba uporządkowania stale rosnącej liczby istotnych biznesowo informacji, pochodzących z dużej ilości źródeł.
Dobrze zaprojektowana baza danych oferuje spójność i integralność zawartych w niej informacji, ale wymaga od użytkownika, aby wprowadzane dane były zgodne z jej modelem.
Mając na uwadze kryterium kosztów lub funkcji, można wybrać spośród kilku dostępnych silników baz danych, między innymi:
• Microsoft SQL Server
• Oracle
• PostgreSQL
• MySQL
Nie zawsze jednak wszystkie dane w organizacji są przechowywane w bazie danych. Mimo obecności wielu systemów zarządzania informacją w przedsiębiorstwie, czasem wygodniej i szybciej jest zapisać część danych w postaci pliku, np. arkusza kalkulacyjnego Excel lub PDF. Dane zapisane w ten sposób mogą być na tyle duże i istotne, aby stanowić uzupełnienie danych umieszczonych w bazie. Może się okazać, że dane zawierają podobne informacje, ale struktura oraz specyfika miejsca przechowywania każdego z nich różni się. Każdorazowe przekształcanie danych tak, aby miały wspólny model bywa zbyt pracochłonne i niedostatecznie efektywne, co może utrudnić proces przetwarzania lub dotarcia do informacji.
Power BI jako narzędzie integracji danych
Silną stroną Power BI jest możliwość połączenia z danymi z różnych źródeł. To rozbudowane narzędzie do budowy interaktywnych analiz pozwala utworzyć wspólny model danych, poprzez integrację danych z źródeł zarówno ze środowiska lokalnego, jak i chmurowego.
Poniżej przedstawiono dostępne typy źródeł danych, które w Power BI zostały podzielone według określonych kategorii. Microsoft stale rozszerza źródła danych, dlatego często można zauważyć źródła danych oznaczone jako beta lub wersja zapoznawcza.
Power BI – źródła danych
Nawiązywanie połączenia ze źródłami danych odbywa się przy pomocy Power Query wbudowanego w Power BI.
Power Query to narzędzie przygotowania danych, w którym zachodzą następujące procesy: wyodrębniania, przekształcania oraz ładowania danych (ETL).
Dzięki możliwości integracji różnych źródeł danych Power BI może stanowić hurtownię danych dla organizacji, gdzie wszystkie przekształcenia wykonywane na danych są wspólne, niezależnie od ograniczeń, które mogą istnieć w pierwotnym źródle danych.
Transformacje danych w Power Query nie ingerują w strukturę źródła – pozostaje ono w niezmiennej postaci. Cecha ta jest istotna, zwłaszcza gdy nasze źródła różnią się zarówno technologią, na której są oparte, czy strukturami danych, które prezentują.
Obecnie Power Bi oferuje nam dwie możliwości pracy z Power Query, oba zapewniają niemal identyczne środowisko:
Power Query Online — używany do integracji, takich jak m.in. przepływy danych Power BI, przepływy danych usługi Microsoft Power Platform, przepływy danych Azure Data Factory i wiele innych.
Power Query Desktop — używany do integracji, takich jak Power BI Desktop i Query dla Excel.
Podsumowując – dzięki agregacji danych z wielu źródeł, raporty przygotowywane przy użyciu Power BI mogą obejmować zakres szerszy niż pojedyncza baza danych.
Pozwala to na przygotowanie dokładnych i spójnych analiz biznesowych.
Dane autoryzacyjne do źródeł danych są zapisane w modelu danych i automatycznie wykorzystywane do nawiązania połączenia przy wywołaniu jednej procedury ładowania danych. W efekcie dane, które wcześniej były dostępne w wielu źródłach mogą zostać łatwo złączone i pobrane do wspólnego zestawu danych, który może być przetwarzany w chmurze usługi Power BI lub zapisywany lokalnie na urządzeniu przy użyciu narzędzia Power BI Desktop.