Jak obliczyć przedział ufności w Excelu?

Udostępnij:

Kiedy mówisz o statystyce rzadko można zrobić test populacji jako całości, jeśli liczba jest duża. Wybierasz więc małą grupę z tej dużej populacji i pracujesz nad nią.

Wynik uzyskany z próbki daje ci wskazówkę na temat całej populacji. Ale spowodowałoby to błędy, ponieważ wyniki są takie same dla całej populacji. Dlatego dokładniej jest podać wynik w pewnym przedziale, niż podawać go jako pojedynczą wartość. Przedział ten nazywamy przedziałem ufności

.
  • Oblicza się ją dla szans i czynników ryzyka. Dlatego też jest powszechnie stosowany w inżynierii i medycynie.
  • Im bliżej dolnej i górnej granicy przedziału ufności, tym węższy jest przedział ufności. Oznacza to, że prognoza dla całej populacji jest bardziej dokładna.
  • Przedział ufności oblicza się za pomocą błędu standardowego. Niższy błąd standardowy oznacza dokładniejszy przedział ufności.
  • Większa próbka populacji oznacza dokładniejsze wyniki, ponieważ jest więcej osób, które obliczamy, a to sprawia, że nasza próbka jest bliższa całej populacji.

Dlaczego potrzebujesz przedziału ufności?

Kiedy prowadzi się badania na dużych grupach, naprawdę trudno jest zebrać dane od każdej osoby w tej populacji, jeśli chodzi o czas i zasoby. Dlatego zamiast tego wybieramy mniejszą grupę, która naszym zdaniem najlepiej reprezentuje całą populację i na jej podstawie dokonujemy obliczeń.

Grupa ta nazywana jest próbką wielkości

.Na przykład, projektujesz nową aplikację dla biegaczy. Nie jest możliwe, aby śledzić każdego biegacza w kraju i poprosić ich o opinie na temat tej aplikacji.

Zamiast tego wybierasz małą grupę osób, które Twoim zdaniem reprezentują całą populację najlepiej

pracować stamtąd.

Kolejną dobrą rzeczą w poufnych interwałach jest to, że możesz obliczyć w zależności od tego, jak bardzo chcesz być pewien swoich wyników. Domyślna dokładność wynosi zazwyczaj 95%

. Oznacza to, że możesz mieć 95% pewności, że przedział ufności z próbki zawiera średnią populacji.

Jeśli chcemy być bardziej

pewni, możemy obliczyć 99% przedział ufności. To również oznacza, że możemy być pewni w 99%, że przedział ufności z próbki zawiera średnią populacji.

Te poziomy ufności mówią nam, że jeśli przeprowadzimy badania w grupach po 100 osób, 99 osób w tych grupach będzie miało ten sam wynik. Jeśli zrobisz je w grupach 1000, 990 osób będzie miało takie same wyniki, i tak dalej.

Kiedy obliczamy przedział ufności na podstawie liczebności próby, może pojawić się problem. Średnia z próby może być zbyt podobna do średniej dla populacji lub może być bardzo różna. Nazywa się to błędem próbkowania i zobaczysz, jak go wykorzystać w następnym rozdziale tego artykułu.

Gdzie można użyć przedziału ufności?

Załóżmy, że jesteś szefem firmy farmaceutycznej produkującej leki dla diabetyków. Tobie i Twojemu zespołowi udało się wyeliminować dwie receptury, które będą stosowane u pacjentów.

W idealnym scenariuszu połowie pacjentów podajesz lek X, a drugiej połowie lek Y

. Ale nie jest to możliwe dla populacji docelowej, ponieważ jest ona zbyt duża. Wybieramy więc tylko grupę pacjentów, która naszym zdaniem lepiej reprezentuje całą populację i podajemy im lek.

Wyniki dadzą nam dobry punkt do zgadywania, który lek działa lepiej, ale ponieważ nie mogliście wypróbować go na całej populacji, nie możecie trzymać się jednego wyniku.

Zbieramy więc wszystkie informacje i obliczamy przedział. To jest przedział ufności i daje nam lepsze wyobrażenie o leku.

Powiedzmy, że po kilku miesiącach zauważyłeś, że odsetek wyleczeń wśród tych pacjentów wynosi 20%. Niektórzy z nich uzyskują poprawę o 60%, a niektórzy o 40%.

W naszym 95% przedziale ufności, dolny przedział ufności wynosi 40%, a górny 60%.

Oznacza to, że jeśli spróbujemy tego samego ze 100 innymi grupami, możemy osiągnąć ten sam wynik u 95 z nich. I możesz mieć 95% pewności, że wskaźnik wyleczenia wśród tych dwóch leków będzie pomiędzy 40% a 60%. Gdyby granica między nimi była wąska, oznaczałoby to, że odniosłeś większy sukces.

Jak matematycznie obliczyć przedział ufności?

Być może nie jesteś dobry z matematyki i nie musisz być, aby samodzielnie obliczyć przedział ufności. Pozwól, że pokażemy Ci proces obliczania na przykładzie z życia wziętym:

Załóżmy, że jesteś weterynarzem i musisz kupić klatkę transportową dla kotów w swojej klinice. Każdy kot ma oczywiście inną wagę

, więc musisz odgadnąć wagę kotów, którymi będziesz się zajmował w przyszłości.

W tym celu można zważyć wszystkie koty znajdujące się w pobliżu, ale w rzeczywistości byłoby to bardzo uciążliwe i długotrwałe, ponieważ kotów są setki. Tak więc dochodzimy do pierwszego kroku:

1) Wybór grupy testowej do obliczeń:

Możesz wybrać dziesięć kotów do ważenia, które twoim zdaniem lepiej pasują do twojego eksperymentu. Łatwiej jest pracować na mniej zatłoczonej grupie. Dziesięć kotów, które wybierzesz mają różne wagi.

Załóżmy, że nasz zestaw danych to 3, 3, 3.5, 4, 4.5, 3.7, 3.3, 4.2, 3.8 i 4

. Są to kilogramy kotów, które zważyłeś.

2) Oblicz średnią z próby: Średnia jest bardzo łatwym do obliczenia terminem statystycznym. Daje nam ona średnią wartość w zbiorze danych

. Wszystko, co musisz zrobić, to zsumować wszystkie dane i podzielić je na liczbę punktów danych.

3) Oblicz odchylenie standardowe:

Aby obliczyć odchylenie standardowe próbki, musisz znaleźć średnią danych, co zrobiłeś w drugim kroku.

Następnie należy znaleźć wariancję danych lub średni kwadrat ich różnicy od

średniej. Po znalezieniu tej liczby, weź jej pierwiastek kwadratowy.

Może to brzmieć skomplikowanie, ale możesz użyć kalkulatora do tego kroku. Wynik tego obliczenia będzie równy 0,5011

. Nasza wartość odchylenia standardowego wynosi około 0,5.

4) Wybierz pożądany poziom ufności: Najczęściej spotykane poziomy ufności to 90%, 95% i 99%. W tym przykładzie wybierzemy 95%.


Polecane lektury: Jak obliczyć wynik Z w Excelu?


5) Oblicz błąd standardowy:

Oznacza to pomnożenie wartości krytycznej przez odchylenie standardowe. Aby obliczyć wartość krytyczną, zamieniamy 95% (nasz poziom ufności) na 0,95. Dzieląc ją na 2 otrzymamy 0, 475. Otwórz sobie wykres Z-Score i zobaczysz, że najbliższą wartością jest 1,96 na przecięciu 1,9 wiersza i 0,06 kolumny.

Nasza wartość ufności wynosi około 0,31.

6) Dodaj wartość przedziału ufności do średniej i odejmij od średniej:

Dolna granica będzie wynosić 3,39, a górna 4,01. Teraz możesz odgadnąć wagę kotów i kupić odpowiednią klatkę transportową.

Jak obliczyć przedział ufności w Excelu?

Teraz, gdy dowiedziałeś się, co to jest przedział ufności, dlaczego jest potrzebny, jak go używać i jak go matematycznie obliczyć, możesz zacząć uczyć się, jak używać tej funkcji w Excelu.

Zaczynajmy!

Krok 1: Zapisz swój zestaw danych

Uczysz się, jak zrobić ciasteczka, ale nigdy nie wydaje się, aby zorganizować odpowiednią porcję cukru, aby zrobić doskonały jeden. Zanotowałeś więc, ile cukru używasz za każdym razem, aby znaleźć właściwą porcję.

Załóżmy, że porcje cukru dla twoich ostatnich dziesięciu eksperymentów wyglądają następująco: 100, 52, 54, 67, 73, 86, 40, 102, 88 i 90. Są one zapisane od B2 do B11 w rubryce Porcja cukru (gr).

Krok 2: Zinterpretuj swoją formułę

Wzór w programie Microsoft Excel na przedział ufności to po prostu:

=PRZERWAŁ WIARYGODNOŚCI (alfa, odchylenie standardowe, wielkość)

Oznacza to, że przed obliczeniem przedziału ufności należy określić trzy różne statystyki.

  • Alfa: "Alfa to poziom punktowy, który jest obliczany jako 1 - poziom ufności; poziom ufności 95% ma poziom istotności 0,05". Oznacza stosunek osobników, które nie zawierają twoich średnich populacji.
  • Odchylenie standardowe: Odchylenie standardowe to termin statystyczny, który pokazuje nam zakres pomiędzy średnią populacji a rzeczywistymi danymi.
  • Wielkość: Wielkość to rozmiar populacji. Liczba osób wprowadzonych do zestawu danych.

Krok 3: Obliczanie wymaganych wartości

Teraz obliczysz te trzy wartości.

  1. Przedział ufności jest zwykle obliczany z 95% wartością ufności i tego będziemy się trzymać w naszym przykładzie. Możesz ją zmienić, jeśli chcesz. Tak więc wartość alfa dla nas będzie wynosić 0,05.
  2. Aby obliczyć odchylenie standardowe, należy najpierw wyznaczyć średnią. Wzór na obliczenie średniej jest następujący:
=ŚREDNIA(C3: C12)

Nasza średnia dla tego przykładu wynosi 75.2.

Po obliczeniu średniej możesz zacząć obliczać odchylenie standardowe.

Jeśli używasz wersji Excela po 2007 roku, formuła powinna wyglądać następująco:

=STDEV.S (C3:C12)

Ale jeśli używasz starej wersji, używasz formuły STDEV. Jest to:

=STDEV (C3:C12)

Odchylenie standardowe dla naszego przykładu wynosi 21,42584.

Wskazówka: Formuła, którą wpisujesz może nie działać w Excelu z powodu pewnych problemów z wersjami. Ale nie martw się Excel poprawi formułę dla Twojej wersji!

  1. Wielkość próbki dla naszego przykładu wynosi 10, ponieważ masz 10 pojedynczych punktów danych.

Krok 4: Umieść swoje obliczenia w formule

Wprowadźmy te wartości do naszej formuły. Powinna ona wyglądać następująco:

=CONFIDENCE (0,05, 21.42584, 10)

  • Alfa: 0,05
  • Odchylenie standardowe: 21.43
  • Wielkość: 10

Ta formuła da nam wartość 13,27963, która jest w przybliżeniu równa 1,28. To jest nasza wartość ufności.

Przedział ufności jest dodawany do średniej i od niej odejmowany. Która wynosi

  • 75,2 + 13,28 = 88,48 górny CI
  • 75,2 - 13,28 = 61,92 dolne CI.

Jak automatycznie obliczyć przedział ufności?

Po pierwsze musisz aktywować pakiet narzędzi w Excelu.

  • Przejdź do zakładki Pliki i kliknij przycisk Opcje.
  • Przejdź do sekcji Dodatki w lewej kolumnie.
  • Na dole zobaczysz opcję Zarządzaj: Excel Add-ins i zobaczysz przycisk z napisem Go.

Istnieją dwa narzędzia, które musisz aktywować w Tool Pak: "Analysis Tool Pak" i "Solver Add-in".

  • Gdy to zrobisz, przejdź do zakładki Dane i tam zobaczysz przycisk Analiza danych.
  • Kliknij OK i pojawi się nowe okno z listą narzędzi do analizy.
  • Przejdź i wybierz opcję Statystyki opisowe.

Po wykonaniu tych czynności pojawi się nowe okno z opcjami. Pierwsza opcja wymaga wprowadzenia zestawu danych do arkusza. Możesz wpisać dane lub kliknąć je i zaznaczyć myszką komórki z danymi

. Uwaga: Znak dolara ($) przed literą kolumny i numerem wiersza służy do blokowania komórek. Blokujesz je za pomocą znaku dolara.

Opcje wyjściowe pozwalają na wprowadzenie analizy w dowolnym miejscu. Zalecamy użycie przycisku "Nowy arkusz" dla oddzielnego arkusza niż ten, na którym pracujesz.

W tym miejscu powinieneś zaznaczyć opcję Statystyka podsumowująca i Poziom ufności średniej

. Jak już wcześniej wspomniano, możesz zmienić poziom ufności, ale my zdecydowaliśmy się zrobić ten przykład ze standardowym 95%.

Po zakończeniu tych czynności kliknij przycisk "OK", aby uruchomić analizę:

Teraz masz naszą analizę w nowym osobnym arkuszu. To narzędzie dało nam wartości średniej, błędu standardowego, mediany, trybu, odchylenia standardowego, wariancji próbki, zakresu, minimum, maksimum, poziomu ufności %

, i więcej.

Oczywiście, nie będziesz używał wszystkich tych wartości, ale dostęp do nich może być naprawdę przydatny w szybki i prosty sposób.

SŁOWA KOŃCOWE

Przedział ufności jest pomocnym i użytecznym pojęciem statystycznym. Ułatwia on obliczanie wyników w dużej grupie danych. Oszczędza nasz czas i jest naprawdę łatwy do obliczenia za pomocą programu Microsoft Excel. Nie zapomnij sprawdzić innych naszych artykułów na temat używania formuł w Excelu.

Socialmedia

Warte uwagi

Przewodnik po typach diagramów UML: Dowiedz się...

Diagramy UML są powszechnie stosowane w celu wizualizacji sposobu działania systemu i przepływu danych w strukturze. W tym artykule poznasz różne rodzaje diagramów UML i dowiesz się, dlaczego...

Sekcje portalu