Analizy statystyczne – co warto wiedzieć

W Erze Informacji dane nie są już rzadkością – są przytłaczające. Kluczem jest przeszukiwanie przytłaczającej ilości danych dostępnych dla organizacji i firm oraz poprawna interpretacja ich konsekwencji. Ale aby przejrzeć wszystkie te informacje, potrzebujesz odpowiednich narzędzi do analizy danych statystycznych.

Przy obecnej obsesji na punkcie “dużych zbiorów danych” analitycy opracowali wiele wymyślnych narzędzi i technik dostępnych dla dużych organizacji. Istnieje jednak garść podstawowych narzędzi do analizy danych, których większość organizacji nie używa … na ich szkodę.

Sugerujemy rozpoczęcie analizy danych z następującymi pięcioma podstawami – i nauczymy się unikać ich pułapek – zanim przejdziemy do bardziej wyrafinowanych technik.
1. Średnia

Średnia arytmetyczna, znana bardziej jako “średnia”, jest sumą listy liczb podzielonej przez liczbę pozycji na liście. Średnia jest użyteczna przy określaniu ogólnego trendu zestawu danych lub szybkiej migawce danych. Kolejną zaletą średniej jest to, że jest ona bardzo łatwa i szybka do obliczenia.

Pułapka:

Sam środek jest niebezpiecznym narzędziem. W niektórych zestawach danych średnia jest również ściśle związana z trybem i medianą (dwa inne pomiary w pobliżu średniej). Jednak w zestawie danych o dużej liczbie wartości odstających lub przekrzywionej dystrybucji, średnia po prostu nie zapewnia dokładności potrzebnej do uzyskania wyrafinowanej decyzji.
2. Odchylenie standardowe

Odchylenie standardowe, często reprezentowane przez grecką sigmę, jest miarą rozpowszechnienia danych wokół średniej. Wysokie odchylenie standardowe oznacza, że ​​dane rozprzestrzeniają się szerzej od średniej, gdzie niskie odchylenie standardowe wskazuje, że więcej danych wyrównuje się ze średnią. W portfolio metod analizy danych standardowe odchylenie jest przydatne do szybkiego określania rozproszenia punktów danych.

Pułapka:

Podobnie jak średnia, odchylenie standardowe jest zwodnicze, jeśli bierze się je samodzielnie. Na przykład, jeśli dane mają bardzo dziwny wzór, taki jak krzywa nienormalna lub duża liczba wartości odstających, odchylenie standardowe nie zapewni wszystkich potrzebnych informacji.
3. Regresja

Regresja modeluje zależności między zmiennymi zależnymi i objaśniającymi, które zazwyczaj są przedstawiane na wykresie rozrzutu. Linia regresji określa również, czy te zależności są silne, czy słabe. Regresja jest zwykle nauczana na licealnych lub koledżowych kursach statystyki z aplikacjami dla nauki lub biznesu w określaniu trendów w czasie.

Pułapka:

Regresja nie jest bardzo zniuansowana. Czasami wartości odstające na wykresie rozrzutu (i ich przyczyny) mają istotne znaczenie. Na przykład punkt oddalony może reprezentować dane wejściowe od najbardziej krytycznego dostawcy lub najlepiej sprzedającego się produktu. Natura linii regresji skłania jednak do ignorowania tych wartości odstających. Jako ilustrację przyjrzyj się obrazowi kwartetu Anscombe, w którym zestawy danych mają dokładnie taką samą linię regresji, ale zawierają bardzo różne punkty danych.


4. Określenie wielkości próbki

Podczas pomiaru dużego zbioru danych lub populacji, np. Siły roboczej, nie zawsze trzeba zbierać informacje od każdego członka tej populacji – próba wykonuje tę samą pracę. Sztuką jest określenie właściwego rozmiaru próbki, aby była dokładna. Stosując metodę proporcji i odchylenia standardowego, jesteś w stanie dokładnie określić odpowiednią wielkość próbki, aby gromadzić dane statystycznie istotne.

Pułapka:

Podczas badania nowej, niesprawdzonej zmiennej w populacji, równania proporcji mogą wymagać pewnych założeń. Jednak te założenia mogą być całkowicie niedokładne. Ten błąd jest następnie przekazywany do określenia rozmiaru próby, a następnie do pozostałej części analizy danych statystycznych

https://www.youtube.com/watch?v=YDsQuTkeFaI


5. Testowanie hipotez

Powszechnie nazywane testowaniem t, testowanie hipotezy ocenia, czy pewne założenie jest prawdziwe dla zbioru danych lub populacji. W analizie danych i statystyce, wynik testu hipotezowego jest statystycznie istotny, jeśli wyniki nie mogłyby mieć miejsca przypadkowo. Testy hipotetyczne są stosowane we wszystkim, od nauki i badań, przez biznes i gospodarkę

Pułapka:

Aby być rygorystycznym, testy hipotez muszą zwracać uwagę na typowe błędy. Na przykład efekt placebo występuje, gdy uczestnicy fałszywie oczekują określonego wyniku, a następnie postrzegają (lub faktycznie osiągają) wynik. Innym częstym błędem jest efekt Hawthorne (lub efekt obserwatora), który występuje, gdy uczestnicy przechylają wyniki, ponieważ wiedzą, że są badani.

Ogólnie rzecz biorąc, te metody analizy danych dają wiele wglądu w twoje portfolio decyzyjne, szczególnie, jeśli nigdy wcześniej nie analizowałeś procesu lub zbioru danych ze statystykami. Jednak unikanie typowych pułapek związanych z każdą metodą jest równie ważne. Po opanowaniu podstawowych technik analizy danych statystycznych możesz przystąpić do bardziej zaawansowanych narzędzi do analizy danych.

Comments are closed.

Advertisement
  • Systemy SAP – zakup, wdrożenie i administracja

    Systemy SAP – zakup, wdrożenie i administracja

    Systemy SAP należą do grona bardzo cenionych i popularnych produktów. Nic dziwnego, dają wiele przydatnych możliwości. Co jest w takim razie bezwzględnie znaczące, jeśli chcemy wprowadzić produkty SAP do własnej działalności? Oczywiście – wybór najlepszych narzędzi. W sytuacji, kiedy nie jesteśmy w stanie samodzielnie zdecydować …
  • Specjalizacja wiedzy kluczem do ulepszenia CV

    Specjalizacja wiedzy kluczem do ulepszenia CV

    Zapotrzebowanie na rynku pracy na specjalistów w poszczególnych dziedzinach zawodowych rośnie. Wynika to przede wszystkim z faktu, że wiedza niezbędna do realizowania różnych rodzajów pracy w ramach jednego zawodu jest coraz większa. Z tego względu coraz trudniej jest być specjalistą w poszczególnych zawodach, który zna …
  • Jak napisać popularne cv.

    Jak napisać popularne cv.

    Każdy ma w życiu czasem takkie chwile, w której warto pomyśleć o usamodzielnieniu się i pracy na własny rachunek musimy znaleźć pracę. Jeśli znajdziemy taka oferte, która będzie warta naszej uwagi powinnismy w tym wypadku sporządzić słynny circuluum vitae dzięki, któremu dana firma dowie się …