Co, jak i dlaczego [+ 5 Learning Resources]

Testowanie hipotez to metoda stosowana przez wielu analityków w sektorze prywatnym i rządowym do formułowania prawdopodobnych stwierdzeń lub założeń dotyczących danych dotyczących populacji.

Jeśli miałeś do czynienia z danymi populacyjnymi lub je studiowałeś, musiałeś natknąć się na to ważne narzędzie do testowania hipotez.

Do formułowania założeń można zastosować wiele metod, ale nie wszystkie zapewniają większą dokładność.

A jeśli nie masz pewności co do swoich danych, ale nadal chcesz z nich korzystać, może to być ryzykowne dla Twojej organizacji.

Testowanie hipotez jest dobrą strategią pozwalającą osiągnąć wyższy poziom dokładności. Odegrał kluczową rolę w analizie populacji.

W tym artykule omówię, czym jest testowanie hipotez, jak działa, jakie są jego zalety i przypadki użycia.

Więc bez zbędnych ceregieli zaczynajmy!

Co to jest testowanie hipotez?

Testowanie hipotez to metoda wnioskowania statystycznego, której analitycy używają do sprawdzenia, czy dostępne dane populacyjne w wystarczającym stopniu potwierdzają daną hipotezę i wyciągają z niej założenia.

Dzięki tej metodzie analitycy mogą łatwo ocenić hipotezę i określić, na ile dokładne jest to założenie na podstawie dostępnych danych.

Mówiąc prościej, jest to proces testowania oparty na statystyce wnioskowania, który pozwala dojść do werdyktu na temat danych populacyjnych na podstawie zebranych danych z próby.

Ogólnie rzecz biorąc, analitycy są prawie niemożliwi do znalezienia właściwości lub jakiegokolwiek konkretnego parametru całej populacji. Ale dzięki testowaniu hipotez możesz dokonać świadomej prognozy i podjąć decyzję na podstawie przykładowych danych i ich dokładności.

Rodzaje testowania hipotez

Różne rodzaje testowania hipotez to:

  • Hipoteza zerowa: Statystyki pokazują, że dane próbki są nagłe i nie ma korelacji między dwiema zmiennymi w danych danych próbki.
  • Hipoteza alternatywna: demonstruje pierwotną tezę i sprzeciwia się hipotezie zerowej. Jest główną siłą napędową procesu testowania, ponieważ pokazuje korelację między dwiema zmiennymi w przykładowych danych.
  • Hipoteza niekierunkowa: Ten rodzaj testowania hipotez służy jako hipoteza dwustronna. Pokazuje, że nie ma kierunku między dwiema zmiennymi w przykładowych danych i że prawdziwa wartość nie jest taka sama jak wartość przewidywana.
  • Hipoteza kierunkowa: Hipoteza kierunkowa przedstawia pewną zależność między dwiema zmiennymi. Tutaj jedna zmienna w przykładowych danych może wpływać na inne zmienne.
  • Hipoteza statystyczna: pomaga analitykom ocenić, czy dane i wartość spełniają określoną hipotezę. Jest to bardzo przydatne przy formułowaniu stwierdzeń i założeń dotyczących wyniku parametru populacji próby.

Następnie omówmy metody testowania hipotez.

Metody testowania hipotez

Aby ocenić, czy dana hipoteza jest prawdziwa, jako analityk będziesz potrzebować wielu wiarygodnych dowodów, aby wyciągnąć wnioski. W tym procesie testowania przed rozpoczęciem oceny ustalana jest hipoteza zerowa i alternatywna.

Testowanie hipotez nie obejmuje tylko jednej metody, ale wiele, aby ocenić, czy przykładowe dane są korzystne. Jako analityk musisz wziąć pod uwagę dane i wielkość próby oraz wybrać odpowiednią metodę testowania hipotez.

Testowanie normalności

Jest to standardowa metoda testowania hipotez służąca do analizy rozkładu regularnego w przykładowych danych. Podczas procesu testowania sprawdzane jest, czy zgrupowane punkty danych wokół średniej znajdują się poniżej, czy powyżej średniej.

W tym teście statystycznym prawdopodobieństwo, że punkty przekroczą lub spadną od średniej, jest równie prawdopodobne. Powstaje krzywa dzwonowa, która jest równomiernie rozłożona po obu stronach średniej.

Testowanie Z

Jest to inny rodzaj testowania hipotez wykorzystywany, gdy dane populacji mają rozkład normalny. Sprawdza, czy średnie dwóch oddzielnych parametrów populacji są różne, gdy znana jest wariancja danych.

Podczas analizowania danych populacji jest wysoce prawdopodobne, że użyjesz tego typu, gdy wielkość próbki danych przekroczy trzydzieści. Co więcej, centralne twierdzenie graniczne jest kolejnym powodem, dla którego test Z jest odpowiedni, ponieważ twierdzenie stwierdza, że ​​gdy rozmiary próbek rosną, próbki mają rozkład normalny.

Testowanie T-testem

Testowanie hipotez T-Test będzie używane, gdy wielkość próby jest ograniczona i zwykle ma rozkład. Ogólnie rzecz biorąc, gdy wielkość próby jest mniejsza niż 30, a odchylenie standardowe parametru nie jest Ci znane, stosuje się je głównie.

Kiedy wykonujesz test T, robisz to, aby obliczyć przedziały ufności dla określonych danych populacji.

Test chi-kwadrat

Test chi-kwadrat jest popularnym procesem testowania hipotez, który jest często używany do oceny dopasowania i integralności rozkładu danych.

Źródło: wikipedia.org

Jednak głównym powodem, dla którego użyjesz tego typu hipotezy, jest testowanie wariancji populacji względem wariancji populacji o zakładanej lub znanej wartości. Przeprowadzane są różne testy chi-kwadrat, ale najbardziej powszechnym typem jest test wariancji i niezależności chi-kwadrat.

Testowanie ANOVA

W skrócie Analiza wariancji, jest to statystyczna metoda testowania, która pomaga porównać zestawy danych z dwóch próbek. Pozwala jednak na porównanie więcej niż dwóch średnich na raz.

Wyjaśnia również zmienną zależną i zmienną niezależną przykładowych danych. Użycie ANOVA jest dość podobne do użycia testu Z i testu T, ale te dwa ostatnie są ograniczone tylko do dwóch średnich.

Jak działa testowanie hipotez?

Każdy analityk, który wykorzystuje testowanie hipotez, wykorzystuje losowe próbki danych do analizy i pomiaru. Podczas testowania dane z próby losowej są wykorzystywane do testowania hipotezy zerowej i hipotezy alternatywnej.

Jak omówiliśmy wcześniej, hipoteza zerowa i hipoteza alternatywna całkowicie wykluczają się wzajemnie, a podczas testowania tylko jedna z nich może być prawdziwa.

Istnieją jednak przypadki, w których hipoteza zerowa zostaje odrzucona; hipoteza alternatywna nie zawsze jest prawdziwa.

Źródło: kroki analityczne

Wartość p: Gdy rozpoczyna się proces testowania, w grę wchodzi wartość p lub wartość prawdopodobieństwa, która pokazuje, czy wynik jest istotny, czy nie. Nie tylko to, ale wartość p pokazuje również prawdopodobieństwo wystąpienia błędu w odrzuceniu lub nieodrzuceniu hipotezy zerowej podczas testowania. Otrzymana wartość p wynosi 0 lub 1 i jest następnie porównywana z poziomem istotności lub poziomem alfa.

Poziom istotności określa tutaj akceptowalne ryzyko przy odrzuceniu hipotezy zerowej podczas testowania. Należy pamiętać, że wynik testu hipotezy może prowadzić do dwóch rodzajów błędów:

  • Błąd pierwszego rodzaju występuje, gdy wynik testu odrzuca hipotezę zerową, mimo że jest ona prawdziwa.
  • Błąd typu 2 pojawia się, gdy hipoteza zerowa zostaje zaakceptowana przez wynik próbki, mimo że jest fałszywa.

Wszystkie wartości, które powodują odrzucenie hipotezy zerowej, są przechowywane w obszarze krytycznym. I to właśnie wartość krytyczna oddziela regiony krytyczne od innych.

Kroki przeprowadzania testowania hipotez

źródło: medium

Testowanie hipotez obejmuje głównie cztery etapy:

  • Zdefiniuj hipotezy: W pierwszym kroku Twoim zadaniem jako analityka jest zdefiniowanie dwóch hipotez, tak aby tylko jedna mogła być prawdziwa. Hipoteza zerowa wskaże, że nie ma różnicy w średnim BMI, podczas gdy hipoteza alternatywna będzie stwierdzać, że istnieje znacząca różnica w średnim BMI.
  • Zaplanuj: w następnym kroku będziesz musiał zaprojektować plan analizy, w jaki sposób możesz analizować przykładowe dane. Bardzo ważne jest, aby przeprowadzić próbkowanie i zebrać przykładowe dane, aby upewnić się, że są one przeznaczone do sprawdzenia Twojej hipotezy.
  • Analizuj przykładowe dane: Po podjęciu decyzji o sposobie oceny danych nadszedł czas, aby rozpocząć proces. Będziesz musiał fizycznie przeanalizować przykładowe dane, aby nie było nadmiarowości. Podczas analizy danych należy sprawdzić, czy próbki są od siebie niezależne i czy obie próby są wystarczająco duże.
  • Oblicz statystyki testu: Na tym etapie będziesz musiał obliczyć statystyki testu i znaleźć wartość p. Wartość p zostanie określona przy założeniu, że hipoteza zerowa jest prawdziwa.
  • Oceń wynik: W ostatnim kroku będziesz musiał ocenić wynik testu hipotezy. Tutaj zdecydujesz, czy odrzucić hipotezę zerową, czy też stwierdzić jej prawdziwość na podstawie przykładowych danych.

Teraz zbadamy korzyści płynące z testowania hipotez.

Korzyści z testowania hipotez

Korzyści z testowania hipotez to:

  • Pomaga przeanalizować siłę roszczenia w sprawie decyzji dotyczącej danych.
  • Jako analityk pozwala na stworzenie niezawodnego środowiska do decydowania o przykładowych danych.
  • Pozwala określić, czy przykładowe dane używane do testowania hipotez są statystycznie istotne.
  • Jest to korzystne dla oceny wiarygodności i trafności wyników testów w każdym systematycznym procesie testowania.

Pomaga w ekstrapolacji danych z etapu próbki na większą populację w zależności od wymagań.

Przypadki użycia testowania hipotez

Testowanie hipotez jest wykorzystywane w różnych sektorach w celu odpowiedniego odgadnięcia dokładności przykładowych danych. Niektóre rzeczywiste przykłady testowania hipotez to:

# 1. Badania kliniczne

Testowanie hipotez jest szeroko stosowane podczas badań klinicznych, ponieważ pomaga lekarzom zdecydować, czy nowy lek, leczenie lub procedura będzie skuteczna, czy nie, na podstawie danych z próbek.

Lekarz może pomyśleć, że leczenie może obniżyć poziom potasu u niektórych pacjentów. Lekarz może zmierzyć poziom potasu grupie pacjentów przed wykonaniem zabiegu i ponownie sprawdzić poziom.

Następnie lekarz stawia hipotezę, gdzie H0: Upo = Uprzed, co oznacza, że ​​poziom potasu po zastosowaniu kuracji jest taki sam jak przed. Inna hipoteza wskazuje na Ha: Upo < Uprzed, co oznacza, że ​​poziom potasu obniżył się po zastosowaniu kuracji.

Jeśli więc wartość p jest mniejsza niż poziom istotności, lekarz może stwierdzić, że leczenie może obniżyć poziom potasu.

#2. Produkcja

Testowanie hipotez jest wykorzystywane w zakładach produkcyjnych, aby pomóc przełożonym zdecydować, czy nowa metoda lub technika jest skuteczna, czy nie.

Na przykład niektóre jednostki produkcyjne mogą stosować testowanie hipotez, aby stwierdzić, czy nowa metoda pomaga im zmniejszyć liczbę wadliwych produktów na partię. Załóżmy, że liczba wadliwych produktów wynosi 300 na partię.

Producent musi określić średnią dla całkowitej liczby wadliwych produktów wyprodukowanych przed i po zastosowaniu metody. Mogą przeprowadzać testowanie hipotez i posługiwać się hipotezami H0: Upo = Uprzed, gdzie średnia produktów wadliwych wytworzonych po zastosowaniu nowej metody jest taka sama jak poprzednio.

Inna hipoteza wskazuje, że HA: Upo nie równa się Uprzed, co oznacza, że ​​całkowita liczba wadliwych produktów wyprodukowanych po zastosowaniu nowej metody nie jest taka sama.

Po teście, gdy wartość p jest mniejsza od poziomu istotności, jednostka produkcyjna może stwierdzić, że liczba wyprodukowanych produktów wadliwych uległa zmianie.

#3. Rolnictwo

Testowanie hipotez jest często stosowane w celu ustalenia, czy nawozy lub pestycydy powodują wzrost i odporność roślin. Biolodzy mogą wykorzystać testy, aby udowodnić, że dana roślina może urosnąć o więcej niż 15 cali po zastosowaniu nowego nawozu.

Biolog może stosować nawóz przez miesiąc, aby zebrać próbki danych. Kiedy biolog przeprowadza test, jedną z hipotez jest H0 U=15 cali, co wskazuje, że nawóz nie powoduje poprawy średniego wzrostu rośliny.

Inna hipoteza mówi, że HA: U> 15 cali, co oznacza, że ​​nawozy powodują zwiększenie średniego wzrostu rośliny. Po przetestowaniu, gdy wartość p jest mniejsza niż poziom istotności, biolog może teraz udowodnić, że nawozy powodują większy wzrost niż wcześniej.

Zasoby edukacyjne

# 1. Statystyki: wprowadzenie krok po kroku od Udemy

Udemy oferuje kurs dotyczący statystyki, w ramach którego nauczysz się krok po kroku wprowadzenia do statystyki, obejmującego testowanie hipotez. Ten kurs zawiera przykłady i lekcje od byłego analityka danych Google, które pomogą Ci opanować przedziały ufności, testy hipotez i nie tylko.

#2. Niezbędne statystyki do analizy danych od Udemy

Ten kurs Udemy na temat podstawowych statystyk do analizy danych pomoże Ci nauczyć się statystyki za pomocą rzeczywistych projektów, zabawnych zajęć, testowania hipotez, rozkładów prawdopodobieństwa, analizy regresji i nie tylko.

#3. Statystyka dla nauki o danych i analizy biznesowej

Udemy oferuje ten kurs dotyczący statystyki do analizy danych i analizy biznesowej, który pomoże Ci nauczyć się testowania hipotez. Obejmuje różne tematy statystyczne, umożliwiając naukowcom danych i analitykom biznesowym ich naukę i opanowanie. Obejmuje statystyki wnioskowania i opisowe wraz z analizą regresji.

#4. Testowanie hipotez autorstwa Jima Frosta

Ta książka jest dostępna na Amazon i jest intuicyjnym przewodnikiem pomagającym analitykom w podejmowaniu decyzji opartych na danych.

Obejmuje działanie testów hipotez, dlaczego ich potrzebujesz, jak skutecznie wykorzystywać przedziały ufności, wartości p, poziomy istotności i wiele innych tematów.

#5. Testowanie hipotez Scotta Hartshorna

Ta książka jest wyjątkowa dzięki wizualnym przykładom i jest najlepsza dla początkujących, którzy szukają krótkiego przewodnika po testowaniu hipotez.

Wprowadzi cię w znaczenie statystyk, typów i ich działania. Nie wymaga wcześniejszej dogłębnej znajomości statystyki, ale wyjaśnia wszystko intuicyjnie.

Ostatnie słowo

Testowanie hipotez pomaga zweryfikować założenie, a następnie opracować dane statystyczne na podstawie oceny. Jest wykorzystywana w wielu sektorach, od produkcji i rolnictwa po badania kliniczne i IT. Ta metoda jest nie tylko dokładna, ale także pomaga w podejmowaniu decyzji w Twojej organizacji na podstawie danych.

Następnie sprawdź zasoby szkoleniowe, aby zostać analitykiem biznesowym.