Analizy statystyczne – co warto wiedzieć

W Erze Informacji dane nie są już rzadkością – są przytłaczające. Kluczem jest przeszukiwanie przytłaczającej ilości danych dostępnych dla organizacji i firm oraz poprawna interpretacja ich konsekwencji. Ale aby przejrzeć wszystkie te informacje, potrzebujesz odpowiednich narzędzi do analizy danych statystycznych.

Przy obecnej obsesji na punkcie “dużych zbiorów danych” analitycy opracowali wiele wymyślnych narzędzi i technik dostępnych dla dużych organizacji. Istnieje jednak garść podstawowych narzędzi do analizy danych, których większość organizacji nie używa … na ich szkodę.

Sugerujemy rozpoczęcie analizy danych z następującymi pięcioma podstawami – i nauczymy się unikać ich pułapek – zanim przejdziemy do bardziej wyrafinowanych technik.
1. Średnia

Średnia arytmetyczna, znana bardziej jako “średnia”, jest sumą listy liczb podzielonej przez liczbę pozycji na liście. Średnia jest użyteczna przy określaniu ogólnego trendu zestawu danych lub szybkiej migawce danych. Kolejną zaletą średniej jest to, że jest ona bardzo łatwa i szybka do obliczenia.

Pułapka:

Sam środek jest niebezpiecznym narzędziem. W niektórych zestawach danych średnia jest również ściśle związana z trybem i medianą (dwa inne pomiary w pobliżu średniej). Jednak w zestawie danych o dużej liczbie wartości odstających lub przekrzywionej dystrybucji, średnia po prostu nie zapewnia dokładności potrzebnej do uzyskania wyrafinowanej decyzji.
2. Odchylenie standardowe

Odchylenie standardowe, często reprezentowane przez grecką sigmę, jest miarą rozpowszechnienia danych wokół średniej. Wysokie odchylenie standardowe oznacza, że ​​dane rozprzestrzeniają się szerzej od średniej, gdzie niskie odchylenie standardowe wskazuje, że więcej danych wyrównuje się ze średnią. W portfolio metod analizy danych standardowe odchylenie jest przydatne do szybkiego określania rozproszenia punktów danych.

Pułapka:

Podobnie jak średnia, odchylenie standardowe jest zwodnicze, jeśli bierze się je samodzielnie. Na przykład, jeśli dane mają bardzo dziwny wzór, taki jak krzywa nienormalna lub duża liczba wartości odstających, odchylenie standardowe nie zapewni wszystkich potrzebnych informacji.
3. Regresja

Regresja modeluje zależności między zmiennymi zależnymi i objaśniającymi, które zazwyczaj są przedstawiane na wykresie rozrzutu. Linia regresji określa również, czy te zależności są silne, czy słabe. Regresja jest zwykle nauczana na licealnych lub koledżowych kursach statystyki z aplikacjami dla nauki lub biznesu w określaniu trendów w czasie.

Pułapka:

Regresja nie jest bardzo zniuansowana. Czasami wartości odstające na wykresie rozrzutu (i ich przyczyny) mają istotne znaczenie. Na przykład punkt oddalony może reprezentować dane wejściowe od najbardziej krytycznego dostawcy lub najlepiej sprzedającego się produktu. Natura linii regresji skłania jednak do ignorowania tych wartości odstających. Jako ilustrację przyjrzyj się obrazowi kwartetu Anscombe, w którym zestawy danych mają dokładnie taką samą linię regresji, ale zawierają bardzo różne punkty danych.


4. Określenie wielkości próbki

Podczas pomiaru dużego zbioru danych lub populacji, np. Siły roboczej, nie zawsze trzeba zbierać informacje od każdego członka tej populacji – próba wykonuje tę samą pracę. Sztuką jest określenie właściwego rozmiaru próbki, aby była dokładna. Stosując metodę proporcji i odchylenia standardowego, jesteś w stanie dokładnie określić odpowiednią wielkość próbki, aby gromadzić dane statystycznie istotne.

Pułapka:

Podczas badania nowej, niesprawdzonej zmiennej w populacji, równania proporcji mogą wymagać pewnych założeń. Jednak te założenia mogą być całkowicie niedokładne. Ten błąd jest następnie przekazywany do określenia rozmiaru próby, a następnie do pozostałej części analizy danych statystycznych

https://www.youtube.com/watch?v=YDsQuTkeFaI


5. Testowanie hipotez

Powszechnie nazywane testowaniem t, testowanie hipotezy ocenia, czy pewne założenie jest prawdziwe dla zbioru danych lub populacji. W analizie danych i statystyce, wynik testu hipotezowego jest statystycznie istotny, jeśli wyniki nie mogłyby mieć miejsca przypadkowo. Testy hipotetyczne są stosowane we wszystkim, od nauki i badań, przez biznes i gospodarkę

Pułapka:

Aby być rygorystycznym, testy hipotez muszą zwracać uwagę na typowe błędy. Na przykład efekt placebo występuje, gdy uczestnicy fałszywie oczekują określonego wyniku, a następnie postrzegają (lub faktycznie osiągają) wynik. Innym częstym błędem jest efekt Hawthorne (lub efekt obserwatora), który występuje, gdy uczestnicy przechylają wyniki, ponieważ wiedzą, że są badani.

Ogólnie rzecz biorąc, te metody analizy danych dają wiele wglądu w twoje portfolio decyzyjne, szczególnie, jeśli nigdy wcześniej nie analizowałeś procesu lub zbioru danych ze statystykami. Jednak unikanie typowych pułapek związanych z każdą metodą jest równie ważne. Po opanowaniu podstawowych technik analizy danych statystycznych możesz przystąpić do bardziej zaawansowanych narzędzi do analizy danych.

Comments are closed.

Advertisement
  • Krytyka bliskich w MLM.

    Krytyka bliskich w MLM.

    kiedy postanowimy byc cierpliwi i rozwijać się w działalności biznesowej jaką jest MLM i kiedy nauczymy się umiejetności jak radzić sobie z uszczypliwymi uwagami na temat tego co robimy czyli wszystkie negatywne opinie, oraz przykre dla nas docinki, wtedy ściezka, oraz rozwój w tym biznesie …
  • Zawód kuriera rowerowego.

    Zawód kuriera rowerowego.

    Nie wazne sa ani warunki atmosferyczne ani temperatura jeśli ktoś naprawdę kocha jazdę na rowerze zawsze znajdzie czas żeby móc na nim pojeździć. Sklepy rowerowe przezywają w naszym kraju swój rozkwit, a dodatkowo niedawno jescze dwudziestolecie. Mozna więc nieco szerzej sobie powiedzieć na ten temat …
  • Rozwiązania dla małych i srednich przedsiębiorstw.

    Rozwiązania dla małych i srednich przedsiębiorstw.

    To właśnie dla potrzeb małych i srednich firm powstał system Liebert SmartAisle zapewniający ciągłość pracy infrastruktury. W jego skład wchodzą między innymi systemy zasilania gwarantowanego, klimatyzacji precyzyjnej, szafy przemysłowe wraz z zabudową zimnych korytarzy, listwy zasilające i systemy zdalnego dostępu (KVM) oraz oprogramowanie do monitorowania …