[Explained] Jak tworzyć histogramy w Tableau

Czy analizujesz obszerne zbiory danych w Tableau i standardowe wykresy słupkowe okazują się niewystarczające do efektywnej wizualizacji lub wyciągania wartościowych wniosków? Możesz poszerzyć swoje możliwości, wykorzystując histogramy, które pozwolą ci na lepsze zobrazowanie poszukiwanych informacji.

Wykresy i diagramy dostępne w narzędziach do analizy biznesowej, takich jak Tableau, umożliwiają zobrazowanie podstawowych tendencji w danych biznesowych lub danych pochodzących z ankiet. Gdy pracujemy z rozległym zbiorem danych, a wartości są rozproszone w wielu punktach, warto połączyć kilka punktów danych w zakresy, tworząc segmenty zamiast wizualizować każdy punkt oddzielnie.

W tym momencie nieoceniony staje się histogram. Czy istnieje lepsze narzędzie BI do tworzenia przejrzystych i informatywnych histogramów niż Tableau? Oferuje ono zarówno automatyczne, jak i manualne metody generowania tej ważnej statystycznie formy wizualizacji.

Zapraszam do lektury tego artykułu, aby dowiedzieć się wszystkiego, co niezbędne do stworzenia imponujących histogramów w Tableau w zaledwie kilka minut.

Czym jest histogram?

Histogram to narzędzie statystyczne służące do graficznego przedstawiania rozkładu danych. Na osi X i Y wykresu prezentowane są wartości liczbowe. Składa się ze słupków, których wysokość odzwierciedla częstotliwość lub liczbę wartości w określonych zakresach, zwanych „przedziałami”.

Słupki mogą być ułożone poziomo lub pionowo, w zależności od analizowanego zbioru danych i potrzeb wizualizacyjnych. Wysokość każdego słupka odpowiada częstotliwości występowania danych w danym przedziale.

Histogramy pomagają w wizualnej analizie kształtu i rozkładu danych, ułatwiając identyfikację trendów, odchyleń oraz ogólnych tendencji.

Histogramy są powszechnie wykorzystywane w statystyce i analizie danych do eksploracji zbiorów danych, ponieważ prezentowana wizualizacja jest łatwa do zrozumienia i interpretacji dla odbiorców o różnym poziomie wiedzy.

W skrócie, histogramy stanowią wizualne podsumowanie danych, umożliwiając opowiadanie historii ukrytej w liczbach, co czyni je cennym narzędziem w procesie podejmowania decyzji i wyciągania wniosków z danych.

Znaczenie histogramów w analizie danych i wizualizacji

Oto kluczowe aspekty znaczenia histogramów w analizie danych:

  • Histogramy ułatwiają zrozumienie rozkładu danych poprzez identyfikację wzorców, ogólnych tendencji oraz potencjalnych wartości odstających.
  • To narzędzie analizy statystycznej pomaga również w wykrywaniu błędów lub anomalii w danych, uwidaczniając niespodziewane skoki lub przerwy w rozkładzie.
  • Histogramy wspomagają proces podejmowania decyzji dotyczących wstępnego przetwarzania danych, na przykład przy wyborze odpowiednich rozmiarów przedziałów czy identyfikacji koniecznych przekształceń danych.
  • Możliwość nakładania na siebie różnych histogramów, prezentujących ten sam lub powiązane zbiory danych, pozwala na porównanie różnych grup w obrębie jednego zbioru lub różnych, ale powiązanych zbiorów danych.
  • W procesie decyzyjnym histogramy stanowią klarowny, wizualny dowód potwierdzający decyzje lub działania oparte na analizie danych.
  • Osoby nietechniczne oraz interesariusze biznesowi mogą łatwo zrozumieć przekaz danych za pomocą histogramów.
  • Teraz, gdy znane jest zastosowanie histogramów, pojawia się pytanie: kiedy warto sięgnąć po to narzędzie wizualizacji danych? Przeanalizujmy poniższy przykład problemu analizy i wizualizacji danych:

    Powyższy wykres słupkowy prezentuje nazwy produktów na osi X oraz odpowiadające im wartości sprzedaży na osi Y. W przykładowym zbiorze danych znajduje się 1849 produktów.

    Jak widać na powyższej wizualizacji, wszystkie dane nie mieszczą się na jednym ekranie, a przeglądanie pozostałych produktów wymaga ciągłego przewijania.

    Zgodnie z zasadami wizualizacji danych, wszystkie istotne informacje powinny być prezentowane na jednym ekranie w logiczny sposób. W tym przypadku można pogrupować produkty w kategorie lub przedziały wartości sprzedaży, na przykład 10 USD, 20 USD, 30 USD, itd., w odstępach co 10 USD.

    W tym celu warto utworzyć histogram, który umieści wszystkie produkty w odpowiednich przedziałach sprzedaży, co pozwoli na lepsze zrozumienie danych. Dzięki temu liczba punktów danych zmniejszy się z 1849 do 279, a wszystkie informacje zmieszczą się na jednym ekranie, eliminując konieczność przewijania.

    Dlaczego warto wybrać Tableau do tworzenia histogramów?

    Tableau jest doskonałym wyborem do tworzenia histogramów z kilku istotnych powodów. Po pierwsze, oferuje intuicyjny interfejs, który jest łatwy w obsłudze zarówno dla użytkowników o profilu technicznym, jak i nietechnicznym. Umożliwia to szybkie tworzenie histogramów i interaktywną analizę danych. Elastyczność Tableau objawia się również w możliwości łączenia się z różnorodnymi źródłami danych, co sprawia, że jest ono odpowiednie do szerokiego zakresu projektów.

    Ponadto, Tableau umożliwia szeroką personalizację, pozwalając na dostosowanie histogramów do konkretnych potrzeb i preferencji. Estetyczne wizualizacje generowane przez Tableau nadają profesjonalny charakter prezentacji danych, zwiększając ich oddziaływanie.

    Udostępnianie wyników i współpraca przebiegają w Tableau bezproblemowo, sprzyjając pracy zespołowej i wymianie wiedzy. Aktywna i rozbudowana społeczność użytkowników zapewnia szerokie wsparcie i dostęp do licznych zasobów.

    Podsumowując, łatwość obsługi, integracja danych, możliwości dostosowywania, interaktywność oraz wsparcie społeczności sprawiają, że Tableau jest optymalnym wyborem do tworzenia histogramów.

    Warunki wstępne tworzenia histogramów w Tableau

    Do utworzenia histogramu w Tableau potrzebne jest co najmniej jedno pole danych zawierające wartości, które mają być prezentowane w formie rozkładu. Oto podstawowe wymagania dotyczące danych:

    Pole danych

    Niezbędne jest pole danych, które będzie zawierało wartości do histogramu. To pole reprezentuje zmienne, które chcemy analizować. Na przykład, w przypadku histogramu prezentującego dane sprzedaży, potrzebne będzie pole zawierające dane dotyczące sprzedaży różnych produktów lub z różnych lat czy miesięcy.

    Grupowanie danych

    Konieczne będzie również utworzenie przedziałów dla miary w analizowanym zbiorze danych. W Tableau miara jest metryką, którą monitorujemy. Przykładowo, w zbiorze danych znajduje się kolumna z danymi o sprzedaży różnych produktów. Jest to miara. Można utworzyć tzw. Koszyk sprzedaży, aby umieścić produkty o zbliżonej wartości sprzedaży w odpowiednich przedziałach.

    Częstotliwość lub liczba

    Dodatkowo, wymagane będzie pole, które będzie wskazywało częstotliwość lub liczbę wystąpień każdego punktu danych w danym przedziale. Często jest to generowane przy użyciu funkcji COUNTD lub COUNT w Tableau.

    Ciągłość

    Przedziały miary powinny być ciągłe. W przeciwnym razie histogram będzie wyglądał jak wykres słupkowy, gdzie kolumny będą od siebie oddzielone. Tableau umożliwia również konwersję miar dyskretnych na miary ciągłe za pomocą jednego kliknięcia.

    Kontekst danych

    Dane powinny posiadać odpowiedni kontekst oraz metadane. Należy upewnić się, że mamy odpowiednie informacje o danych, takie jak znaczniki daty czy godziny, kategorie oraz inne atrybuty, które mogą pomóc w analizie.

    Jak utworzyć histogram w Tableau

    Istnieją dwa sposoby tworzenia histogramów w Tableau, korzystając z zewnętrznych zbiorów danych. Pierwszy to automatyczna metoda „Pokaż mi”, a drugi to metoda ręczna. Poniżej znajdują się instrukcje dla obu metod:

    #1. Utwórz histogram w Tableau za pomocą „Pokaż mi”

    Narzędzie „Pokaż mi” w Tableau umożliwia tworzenie różnorodnych wizualizacji danych za pomocą jednego kliknięcia, wykorzystując połączone dane. Generuje ono czytelne wizualizacje tylko wtedy, gdy struktura danych jest poprawna i uporządkowana.

    Połącz źródło danych

    Istnieją trzy sposoby pozyskania źródła danych do naszego ćwiczenia. Można wykorzystać wbudowane zbiory danych, połączyć się z zewnętrznym serwerem lub zaimportować dane z Excela lub pliku CSV. Poniżej znajdują się instrukcje:

  • Uruchom aplikację Tableau Desktop na komputerze PC lub Mac.
  • Kliknij dowolny z Akceleratorów, aby zaimportować gotowe zbiory danych do Tableau.
  • Alternatywnie kliknij opcję Microsoft Excel, Microsoft Access, itd. w sekcji „Do pliku”, aby skonfigurować połączenie.
  • Możesz też wybrać dowolne złącze w sekcji „Do serwera”, aby połączyć Tableau z zewnętrznym zbiorem danych przechowywanym w chmurze lub na lokalnym serwerze SQL.
  • Wybierz miarę

  • Po połączeniu zbioru danych powinien wyświetlić się nowy, pusty arkusz w Tableau.
  • Jeśli ćwiczysz, korzystając z dowolnego akceleratora Tableau, kliknij przycisk „Nowy arkusz” na dolnym pasku menu Tableau.
  • Otworzy się pusty arkusz.
  • Z lewego panelu nawigacji przeciągnij wybraną miarę do pola „Kolumny” u góry nazwy arkusza.
  • Użyj opcji „Pokaż mi”, aby utworzyć histogram

    Teraz wystarczy kliknąć menu „Pokaż mi” w prawym górnym rogu aplikacji Tableau Desktop. Pojawi się menu wizualizacji danych Tableau.

    Tam kliknij opcję „Histogram”, aby szybko utworzyć automatyczną wizualizację histogramu wygenerowaną przez Tableau.

    #2. Utwórz ręcznie histogram w Tableau

    W pewnych przypadkach automatycznie wygenerowane histogramy mogą nie prezentować pożądanych informacji. Ponadto, aby stać się ekspertem w dziedzinie analizy danych, warto poznać manualne sposoby tworzenia wizualizacji, w tym histogramów. Postępuj zgodnie z poniższymi instrukcjami:

    Połącz zbiór danych z obszarem roboczym Tableau

    Można wykonać wcześniejsze kroki dotyczące łączenia zbiorów danych z Tableau, a następnie przejść do następnego kroku.

    Utwórz przedział za pomocą miary

    Załóżmy, że korzystamy z danych Sample Superstore z Tableau i miary „Sales” (sprzedaż) w odniesieniu do miary „Product Name” (nazwa produktu), aby utworzyć histogram w nowym arkuszu.

  • Wybierz miarę „Sales” z menu „Tabele” w panelu danych Tableau.
  • Kliknij prawym przyciskiem myszy i najedź kursorem na opcję „Utwórz”.
  • Wybierz „Przedziały”.
  • W oknie dialogowym „Edytuj przedziały” wprowadź wartość w polu „Rozmiar przedziału”.
  • Kliknij „OK”, aby zakończyć proces tworzenia przedziału.
  • Teraz przeciągnij utworzony „Koszyk” z panelu „Dane” do pola „Kolumny”.
  • Kliknij prawym przyciskiem myszy koszyk sprzedaży i wybierz opcję „Ciągła” z menu kontekstowego.
  • Dodaj kolejną miarę do wierszy

    Teraz rozwiń hierarchię relacyjną „Product” w panelu „Dane” i odszukaj miarę „Nazwa produktu”. Przeciągnij i upuść tę miarę do pola „Wiersze” w pustym arkuszu.

    Następnie kliknij prawym przyciskiem myszy miarę „Nazwa produktu” w panelu „Wiersze” i wybierz opcję „Miara” > „Liczba”.

    Gratulacje! Pomyślnie utworzono podstawowy histogram w Tableau.

    Zastosuj skalę logarytmiczną

    Otrzymany histogram może nie być wystarczająco przejrzysty. Można zastosować skalę logarytmiczną zarówno do osi Y, jak i X, aby histogram był bardziej czytelny. Wykonaj następujące kroki:

  • Kliknij prawym przyciskiem myszy oś Y i wybierz „Edytuj oś”.
  • W sekcji „Skala” zaznacz pole wyboru „Logarytmiczna” i zamknij okno dialogowe „Edytuj oś”.
  • Podobnie postąp z osią X.
  • Na górnym pasku menu Tableau kliknij ikonę „Pokaż etykiety znaczników”, aby wyświetlić liczbę elementów w każdym przedziale.
  • W ten sposób uzyskasz funkcjonalny histogram, który czytelnie prezentuje dane sprzedaży i nazwy produktów.

    Dodaj więcej miar do koloru

    Do panelu „Znaczniki” można dodać dodatkowe miary, takie jak „Kolor”, „Rozmiar”, „Etykieta”, „Szczegół” i „Etykietka”, aby za pomocą histogramu wizualizować większą ilość danych. Oto jak:

  • Przeciągnij i upuść miarę „Status przesyłki” na zakładkę „Kolor”.
  • Histogram pokaże teraz trójkolorowy rozkład wysłanych zamówień.
  • Najlepsze praktyki tworzenia histogramów w Tableau

    Poniższe wskazówki pomogą Ci w tworzeniu dokładnych, czytelnych i wartościowych histogramów w Tableau:

  • Przed utworzeniem histogramu warto zacząć od wykresu słupkowego w Tableau. Wybór właściwego typu wykresu jest kluczowy, gdyż inne typy, jak wykresy liniowe czy punktowe, nie nadają się do tworzenia histogramów.
  • Należy również zacząć od logicznego i odpowiedniego rozmiaru przedziału dla histogramu. Tableau domyślnie podpowiada rozmiar, który w większości przypadków jest odpowiedni. Można jednak eksperymentować, aby znaleźć najlepszy rozmiar przedziału dla konkretnego zbioru danych.
  • Należy wyraźnie oznaczyć oś X (przedziały) i oś Y (częstotliwość lub liczba). Należy również upewnić się, że jednostki i tytuły są informacyjne.
  • Jeśli dane są silnie asymetryczne lub zawierają wartości odstające, warto rozważyć użycie skali logarytmicznej lub innych przekształceń, aby lepiej zobrazować rozkład.
  • Wykorzystaj kolory i style, aby histogram był atrakcyjny wizualnie. Rozważ kodowanie kolorami, aby wyróżnić konkretne punkty danych lub kategorie.
  • Utwórz kontrolkę przedziału, dodając suwak do właściwości rozmiaru przedziału. Można go przesuwać, aby szybko zmieniać rozmiar przedziału i sprawdzić, czy inna wielkość ujawni interesujące informacje o zbiorze danych.
  • Dodaj adnotacje lub linie odniesienia, aby podkreślić ważne punkty danych lub progi.
  • Uzupełnij wizualizację komentarzami lub opisami, aby była zrozumiała dla innych osób, które mogą z niej korzystać lub ją modyfikować.
  • Wniosek

    Teraz wiesz, jak utworzyć histogram za pomocą Tableau. Poznałeś zarówno automatyczne, jak i ręczne metody generowania histogramu. Wypróbuj opisane metody, korzystając z własnego zbioru danych i poznaj zaawansowane możliwości analizy i wizualizacji danych w Tableau.

    Następnie możesz zapoznać się z informacjami dotyczącymi modelowania danych w Power BI.


    newsblog.pl