forked from ZoltyKaplan/statystyka-machen
Update baza
This commit is contained in:
269
pytania.txt
269
pytania.txt
@@ -10,11 +10,6 @@ Rozkład prawdopodobieństwa dyskretnej zmiennej losowej może być przedstawion
|
|||||||
- w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu
|
- w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu
|
||||||
- jako $\int_{-\infty}^{\infty} f(x) dx$
|
- jako $\int_{-\infty}^{\infty} f(x) dx$
|
||||||
|
|
||||||
Która z poniższych reprezentuje statystyki?
|
|
||||||
- proporcji populacji
|
|
||||||
-| suma zmiennych losowych stanowiących próbę
|
|
||||||
- średnia populacyjna
|
|
||||||
|
|
||||||
Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$:
|
Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$:
|
||||||
-| jest długością 90% przedziału ufności dla wariancji populacji
|
-| jest długością 90% przedziału ufności dla wariancji populacji
|
||||||
- z 90% ufnością obejmuje prawdziwą wartość wariancji populacji
|
- z 90% ufnością obejmuje prawdziwą wartość wariancji populacji
|
||||||
@@ -40,11 +35,6 @@ Załóżmy, że wartość kowariancji próbki między dwiema zmiennymi losowymi
|
|||||||
- istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi
|
- istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi
|
||||||
- kowariancja nie może być ujemna
|
- kowariancja nie może być ujemna
|
||||||
|
|
||||||
Która z poniższych funkcji jest poświęcona testowaniu hipotezy o dopasowaniu rozkładu częstotliwości do konkretnego wzorca?
|
|
||||||
-| chisq.test
|
|
||||||
- var.test
|
|
||||||
- t.test
|
|
||||||
|
|
||||||
Testy nieparametryczne opierają się na:
|
Testy nieparametryczne opierają się na:
|
||||||
- statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym
|
- statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym
|
||||||
-| rangach obserwacji
|
-| rangach obserwacji
|
||||||
@@ -85,11 +75,6 @@ Aby przeprowadzić analizę wariancji (ANOVA) w celu przetestowania hipotezy o r
|
|||||||
-| normalność rozkładu każdej populacji i homogeniczność wariancji populacji
|
-| normalność rozkładu każdej populacji i homogeniczność wariancji populacji
|
||||||
- równość rozmiarów próbek i homogeniczność wariancji próbek
|
- równość rozmiarów próbek i homogeniczność wariancji próbek
|
||||||
|
|
||||||
Jeśli linia regresji ma postać $y = b_0 + b_1x$, to ujemna wartość estymacji $b_1$ pokazuje:
|
|
||||||
- jak duża jest wartość $y$, gdy $x$ jest równy estymacji $b_1$
|
|
||||||
- o ile wartość $y$ wzrasta, gdy $x$ maleje o estymację $b_1$
|
|
||||||
-| o ile wartość $y$ maleje, gdy $x$ wzrasta o 1
|
|
||||||
|
|
||||||
Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu?
|
Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu?
|
||||||
- Test Kołmogorowa-Lillieforsa
|
- Test Kołmogorowa-Lillieforsa
|
||||||
- test Shapiro-Wilka
|
- test Shapiro-Wilka
|
||||||
@@ -142,16 +127,117 @@ Rozważmy eksperyment, w którym badana jest liczba niedopełnionych puszek w za
|
|||||||
-| H Kruskala-Wallisa
|
-| H Kruskala-Wallisa
|
||||||
- testu Wilcoxona
|
- testu Wilcoxona
|
||||||
|
|
||||||
Jeśli równanie prostej regresji ma postać $y=b_0+b_1x$, to ujemna wartość współczynnika regresji $b_1$ informuje:
|
|
||||||
- o ile wzrośnie wartość $y$ jeśli wartość $x$ zmaleje o $b_1$
|
|
||||||
-| o ile zmaleje wartość $y$ jeśli wartość $x$ wzrośnie o 1
|
|
||||||
- jaka jest wartość $y$ dla $x$ równego $b_1$
|
|
||||||
|
|
||||||
Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję:
|
Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję:
|
||||||
- t.test
|
- t.test
|
||||||
-| var.test
|
-| var.test
|
||||||
- sigma.test
|
- sigma.test
|
||||||
|
|
||||||
|
// Statystyka — brakujące pytania ze statystyka.md
|
||||||
|
|
||||||
|
Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej jest:
|
||||||
|
- dowolną funkcją przyjmującą wartości z przedziału od 0 do 1
|
||||||
|
- dowolną funkcją ciągłą, dla której pole pod wykresem wynosi 1
|
||||||
|
-| dowolną funkcją nieujemną, dla której pole pod wykresem wynosi 1
|
||||||
|
|
||||||
|
Zbiór wartości, który z prawdopodobieństwem $1-\alpha$ pokrywa prawdziwą wartość nieznanego parametru populacji, to:
|
||||||
|
- obszar krytyczny
|
||||||
|
- poziom ufności
|
||||||
|
-| przedział ufności
|
||||||
|
|
||||||
|
Do testowania hipotezy o normalności rozkładu populacji można użyć:
|
||||||
|
- funkcji `zsum.test`, jeśli próba jest duża
|
||||||
|
-| funkcji `chisq.test` po odpowiednim pogrupowaniu danych
|
||||||
|
- funkcji `z.test`, jeśli odchylenie standardowe populacji jest znane
|
||||||
|
|
||||||
|
Jeśli te same osoby rozwiązują kilka zadań w losowej kolejności i chcemy porównać rozkłady czasów ich rozwiązywania, użyjemy:
|
||||||
|
- testu Spearmana
|
||||||
|
-| testu Friedmana
|
||||||
|
- testu Kruskala-Wallisa
|
||||||
|
|
||||||
|
Konstruując szereg rozdzielczy lub histogram, należy zadbać, aby przedziały:
|
||||||
|
- mogły się nakładać, o ile nie są puste
|
||||||
|
- nie musiały pokrywać wszystkich wartości
|
||||||
|
-| były rozłączne i pokrywały cały zbiór wartości
|
||||||
|
|
||||||
|
Do weryfikacji hipotezy o dwóch średnich populacyjnych nie użyjemy:
|
||||||
|
- funkcji `zsum.test`, gdy próby są duże i nie pochodzą z rozkładu normalnego
|
||||||
|
-| funkcji `var.test`
|
||||||
|
- funkcji `t.test`, gdy próby pochodzą z rozkładu normalnego
|
||||||
|
|
||||||
|
Notacja $H_0:\mu \geq 5$, $H_1:\mu < 5$ opisuje:
|
||||||
|
- hipotezę lewostronną o średniej z próby
|
||||||
|
- hipotezę prawostronną o średniej populacyjnej
|
||||||
|
-| hipotezę lewostronną o średniej populacyjnej
|
||||||
|
|
||||||
|
Testu chi-kwadrat nie użyjemy bezpośrednio do testowania:
|
||||||
|
- niezależności dwóch zmiennych w tablicy kontyngencji
|
||||||
|
- równości dwóch proporcji populacyjnych
|
||||||
|
-| normalności rozkładu populacji
|
||||||
|
|
||||||
|
Moda (dominanta):
|
||||||
|
- oddziela 75% większych obserwacji od 25% mniejszych obserwacji
|
||||||
|
-| występuje najczęściej w zbiorze obserwacji
|
||||||
|
- jest wartością środkową w zbiorze obserwacji
|
||||||
|
|
||||||
|
Estymatorów współczynników równania regresji nie wyznaczymy za pomocą:
|
||||||
|
- metody najmniejszych kwadratów
|
||||||
|
- funkcji `lm(y~x)`
|
||||||
|
-| funkcji `anova(y~x)`
|
||||||
|
|
||||||
|
W analizie wariancji nie odrzucimy hipotezy zerowej, gdy wartość statystyki testowej jest:
|
||||||
|
- niższa od odpowiedniego kwantyla rozkładu t-Studenta
|
||||||
|
- niższa od odpowiedniego kwantyla rozkładu chi-kwadrat
|
||||||
|
-| niższa od odpowiedniego kwantyla rozkładu F-Snedecora
|
||||||
|
|
||||||
|
Jeżeli $X_1,\ldots,X_n$ jest dużą próbą z rozkładu o wartości oczekiwanej $\mu$ i odchyleniu standardowym $\sigma$, to suma $X_1+\cdots+X_n$ ma asymptotyczny rozkład:
|
||||||
|
- $N(\mu,\sigma/\sqrt{n})$
|
||||||
|
-| $N(n\mu,\sqrt{n}\sigma)$
|
||||||
|
- $N(0,1)$
|
||||||
|
|
||||||
|
Hipotezę zerową odrzucamy, gdy:
|
||||||
|
-| wartość statystyki testowej należy do obszaru krytycznego
|
||||||
|
- wartość statystyki testowej należy do przedziału ufności
|
||||||
|
- poziom istotności jest niższy niż p-value
|
||||||
|
|
||||||
|
Do weryfikacji hipotezy o dwóch proporcjach populacyjnych można wykorzystać funkcję:
|
||||||
|
- `t.test`
|
||||||
|
- `binom.test`
|
||||||
|
-| `prop.test`
|
||||||
|
|
||||||
|
Jeżeli $(L,U)$ jest 95% przedziałem ufności dla odchylenia standardowego populacji, to z ufnością 95% przedział ten:
|
||||||
|
- pokrywa prawdziwą wartość średniej populacyjnej
|
||||||
|
- pokrywa prawdziwą wartość odchylenia standardowego z próby
|
||||||
|
-| pokrywa prawdziwą wartość odchylenia standardowego populacji
|
||||||
|
|
||||||
|
Dodatnia wartość kowariancji między zmiennymi $X$ i $Y$ oznacza, że:
|
||||||
|
-| gdy wartość $X$ rośnie, wartość $Y$ zwykle również rośnie
|
||||||
|
- wartość $Y$ rośnie o wartość kowariancji, gdy $X$ rośnie o 1
|
||||||
|
- gdy wartość $X$ rośnie, wartość $Y$ maleje
|
||||||
|
|
||||||
|
Ujemna wartość współczynnika korelacji między zmiennymi $X$ i $Y$ oznacza, że:
|
||||||
|
- współczynnik korelacji nie może być ujemny
|
||||||
|
- wartość $Y$ maleje dokładnie o wartość współczynnika korelacji, gdy $X$ rośnie o 1
|
||||||
|
-| gdy wartość $X$ rośnie, wartość $Y$ zwykle maleje
|
||||||
|
|
||||||
|
Jeżeli chcemy sprawdzić, czy kolor samochodu wpływa na średnią sprzedaż danego modelu, a dostępne są co najmniej trzy kolory, najrozsądniej jest:
|
||||||
|
- przeprowadzić test chi-kwadrat równości dwóch wariancji
|
||||||
|
-| przeprowadzić analizę wariancji
|
||||||
|
- użyć `t.test` do porównania dwóch średnich
|
||||||
|
|
||||||
|
Gdy dwóch ekspertów sporządza rankingi tych samych tancerzy, do sprawdzenia zgodności ich opinii użyjemy:
|
||||||
|
- testu Pearsona
|
||||||
|
-| testu Spearmana
|
||||||
|
- testu Wilcoxona
|
||||||
|
|
||||||
|
Niech dyskretna zmienna losowa $X$ przyjmuje wartości $x_1<x_2<x_3$ z prawdopodobieństwami odpowiednio $p_1,p_2,p_3$. Wtedy $P(X=x_2)$ wynosi:
|
||||||
|
- $p_1$
|
||||||
|
- 0
|
||||||
|
-| $p_2$
|
||||||
|
|
||||||
|
Jeżeli $y=b_0+b_1x$ jest równaniem prostej regresji, to w teście istotności regresji hipoteza alternatywna ma postać:
|
||||||
|
- $\rho_{XY}=0$
|
||||||
|
-| $b_1\neq 0$
|
||||||
|
- $b_0\neq 0$
|
||||||
|
|
||||||
// Statystyka — pytania analogiczne / potencjalne
|
// Statystyka — pytania analogiczne / potencjalne
|
||||||
|
|
||||||
@@ -170,15 +256,10 @@ Dla ciągłej zmiennej losowej dystrybuanta jest zwykle:
|
|||||||
- funkcją zawsze schodkową
|
- funkcją zawsze schodkową
|
||||||
- funkcją malejącą
|
- funkcją malejącą
|
||||||
|
|
||||||
Dla dyskretnej zmiennej losowej dystrybuanta:
|
|
||||||
-| może mieć skoki w punktach przyjmowanych przez zmienną losową
|
|
||||||
- zawsze jest funkcją gęstości
|
|
||||||
- zawsze jest linią prostą
|
|
||||||
|
|
||||||
Statystyka to:
|
Statystyka to:
|
||||||
-| dowolna funkcja zmiennych losowych stanowiących próbę, niezawierająca nieznanych parametrów
|
-| dowolna funkcja zmiennych losowych stanowiących próbę
|
||||||
- dowolna funkcja nieznanych parametrów populacji
|
- dowolna funkcja parametrów populacji
|
||||||
- wyłącznie średnia populacyjna
|
- średnia populacyjna
|
||||||
|
|
||||||
Która z poniższych wielkości nie jest statystyką?
|
Która z poniższych wielkości nie jest statystyką?
|
||||||
- średnia z próby
|
- średnia z próby
|
||||||
@@ -190,26 +271,6 @@ Która z poniższych wielkości jest statystyką?
|
|||||||
- wariancja populacji $\sigma^2$
|
- wariancja populacji $\sigma^2$
|
||||||
- parametr $\lambda$ rozkładu wykładniczego
|
- parametr $\lambda$ rozkładu wykładniczego
|
||||||
|
|
||||||
Statystyka może być funkcją:
|
|
||||||
-| obserwacji z próby
|
|
||||||
- wyłącznie parametrów populacji
|
|
||||||
- wyłącznie poziomu ufności
|
|
||||||
|
|
||||||
Estymator jest:
|
|
||||||
-| statystyką służącą do szacowania nieznanego parametru populacji
|
|
||||||
- zawsze znanym parametrem populacji
|
|
||||||
- zawsze błędem losowym
|
|
||||||
|
|
||||||
Niech $L$ i $U$ będą statystykami spełniającymi $P(L < \theta < U)=1-\alpha$. Wtedy przedział $(L,U)$ jest:
|
|
||||||
-| przedziałem ufności dla parametru $\theta$ na poziomie ufności $1-\alpha$
|
|
||||||
- przedziałem predykcji dla każdej przyszłej obserwacji
|
|
||||||
- przedziałem zawierającym zawsze wszystkie obserwacje z próby
|
|
||||||
|
|
||||||
Jeżeli $P(L < \mu < U)=0{,}95$, to przedział $(L,U)$ jest:
|
|
||||||
-| 95% przedziałem ufności dla średniej populacji
|
|
||||||
- 95% przedziałem ufności dla średniej próby
|
|
||||||
- 95% przedziałem ufności dla poziomu istotności
|
|
||||||
|
|
||||||
W przedziale ufności dla średniej populacji $\mu$ losowe są:
|
W przedziale ufności dla średniej populacji $\mu$ losowe są:
|
||||||
-| granice przedziału $L$ i $U$
|
-| granice przedziału $L$ i $U$
|
||||||
- parametr $\mu$
|
- parametr $\mu$
|
||||||
@@ -220,41 +281,16 @@ Poziom ufności $1-\alpha$ oznacza:
|
|||||||
- prawdopodobieństwo błędu I rodzaju
|
- prawdopodobieństwo błędu I rodzaju
|
||||||
- wartość średniej populacji
|
- wartość średniej populacji
|
||||||
|
|
||||||
Poziom istotności $\alpha$ oznacza:
|
|
||||||
-| prawdopodobieństwo popełnienia błędu I rodzaju
|
|
||||||
- prawdopodobieństwo popełnienia błędu II rodzaju
|
|
||||||
- prawdopodobieństwo przyjęcia hipotezy zerowej
|
|
||||||
|
|
||||||
Błąd I rodzaju polega na:
|
|
||||||
-| odrzuceniu prawdziwej hipotezy zerowej
|
|
||||||
- nieodrzuceniu fałszywej hipotezy zerowej
|
|
||||||
- odrzuceniu fałszywej hipotezy zerowej
|
|
||||||
|
|
||||||
Błąd II rodzaju polega na:
|
Błąd II rodzaju polega na:
|
||||||
-| nieodrzuceniu fałszywej hipotezy zerowej
|
-| nieodrzuceniu fałszywej hipotezy zerowej
|
||||||
- odrzuceniu prawdziwej hipotezy zerowej
|
- odrzuceniu prawdziwej hipotezy zerowej
|
||||||
- odrzuceniu fałszywej hipotezy zerowej
|
- odrzuceniu fałszywej hipotezy zerowej
|
||||||
|
|
||||||
Jeżeli hipoteza zerowa jest prawdziwa, a my ją odrzucimy, to popełniamy:
|
|
||||||
-| błąd I rodzaju
|
|
||||||
- błąd II rodzaju
|
|
||||||
- błąd estymacji punktowej
|
|
||||||
|
|
||||||
Jeżeli hipoteza zerowa jest fałszywa, a my jej nie odrzucimy, to popełniamy:
|
|
||||||
-| błąd II rodzaju
|
|
||||||
- błąd I rodzaju
|
|
||||||
- błąd standardowy średniej
|
|
||||||
|
|
||||||
Wykres pudełkowy pozwala odczytać:
|
Wykres pudełkowy pozwala odczytać:
|
||||||
-| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum
|
-| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum
|
||||||
- średnią, wariancję i odchylenie standardowe
|
- średnią, wariancję i odchylenie standardowe
|
||||||
- wyłącznie wartości odstające
|
- wyłącznie wartości odstające
|
||||||
|
|
||||||
Z wykresu pudełkowego nie odczytamy bezpośrednio:
|
|
||||||
-| wariancji
|
|
||||||
- mediany
|
|
||||||
- rozstępu międzykwartylowego
|
|
||||||
|
|
||||||
Rozstęp międzykwartylowy to:
|
Rozstęp międzykwartylowy to:
|
||||||
-| różnica między trzecim a pierwszym kwartylem
|
-| różnica między trzecim a pierwszym kwartylem
|
||||||
- różnica między maksimum a minimum
|
- różnica między maksimum a minimum
|
||||||
@@ -265,21 +301,6 @@ Mediana na wykresie pudełkowym jest zazwyczaj przedstawiona jako:
|
|||||||
- koniec górnego wąsa
|
- koniec górnego wąsa
|
||||||
- punkt odstający
|
- punkt odstający
|
||||||
|
|
||||||
ANOVA służy do testowania hipotezy o równości:
|
|
||||||
-| kilku średnich populacyjnych
|
|
||||||
- kilku wariancji z próby
|
|
||||||
- kilku median populacyjnych w każdej sytuacji
|
|
||||||
|
|
||||||
Hipoteza zerowa w jednoczynnikowej analizie wariancji ANOVA mówi, że:
|
|
||||||
-| wszystkie średnie populacyjne są równe
|
|
||||||
- wszystkie wariancje z próby są różne
|
|
||||||
- wszystkie populacje mają rozkład jednostajny
|
|
||||||
|
|
||||||
Po odrzuceniu hipotezy zerowej w ANOVA możemy stwierdzić, że:
|
|
||||||
-| co najmniej jedna średnia populacyjna różni się od pozostałych
|
|
||||||
- wszystkie średnie populacyjne są na pewno parami różne
|
|
||||||
- wszystkie wariancje populacyjne są równe
|
|
||||||
|
|
||||||
Testy post-hoc po ANOVA stosuje się, aby:
|
Testy post-hoc po ANOVA stosuje się, aby:
|
||||||
-| sprawdzić, które średnie różnią się istotnie między sobą
|
-| sprawdzić, które średnie różnią się istotnie między sobą
|
||||||
- sprawdzić normalność każdej populacji
|
- sprawdzić normalność każdej populacji
|
||||||
@@ -295,58 +316,44 @@ Funkcja `shapiro.test` służy do:
|
|||||||
- testowania równości wariancji dwóch populacji
|
- testowania równości wariancji dwóch populacji
|
||||||
- testowania niezależności dwóch zmiennych jakościowych
|
- testowania niezależności dwóch zmiennych jakościowych
|
||||||
|
|
||||||
Funkcja `var.test` w R służy do:
|
|
||||||
-| testowania równości wariancji dwóch populacji normalnych
|
|
||||||
- testowania normalności rozkładu
|
|
||||||
- testowania równości kilku średnich populacyjnych
|
|
||||||
|
|
||||||
Funkcja `t.test` w R może służyć do:
|
|
||||||
-| testowania hipotez dotyczących średniej
|
|
||||||
- testowania zgodności rozkładu empirycznego z teoretycznym
|
|
||||||
- testowania normalności rozkładu
|
|
||||||
|
|
||||||
Funkcja `chisq.test` może służyć do:
|
|
||||||
-| testu zgodności lub testu niezależności
|
|
||||||
- testowania średniej populacyjnej przy znanym odchyleniu standardowym
|
|
||||||
- testowania normalności rozkładu
|
|
||||||
|
|
||||||
Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem:
|
Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem:
|
||||||
-| jednoczynnikowej analizy wariancji ANOVA
|
-| jednoczynnikowej analizy wariancji ANOVA
|
||||||
- testu Shapiro-Wilka
|
- testu Shapiro-Wilka
|
||||||
- testu F dla wariancji
|
- testu F dla wariancji
|
||||||
|
|
||||||
Test Wilcoxona stosuje się między innymi, gdy:
|
// Statystyka — uzupełnienie brakujących poprawnych odpowiedzi
|
||||||
-| porównujemy rozkłady bez zakładania normalności
|
|
||||||
- zawsze znamy wariancję populacji
|
|
||||||
- badamy wyłącznie zmienne nominalne
|
|
||||||
|
|
||||||
Kowariancja ujemna oznacza, że:
|
Do testowania hipotezy o dwóch średnich populacyjnych dla dużych prób można wykorzystać funkcję:
|
||||||
-| wzrostowi jednej zmiennej zwykle towarzyszy spadek drugiej zmiennej
|
- `t.test`
|
||||||
- zmienne nie mogą być ze sobą powiązane
|
-| `zsum.test`
|
||||||
- obie zmienne zawsze mają rozkład normalny
|
- `var.test`
|
||||||
|
|
||||||
Dodatnia wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
|
Funkcja `binom.test` w R służy między innymi do:
|
||||||
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
|
- testowania równości wariancji dwóch populacji
|
||||||
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $b_1$
|
-| testowania hipotezy o jednej proporcji populacyjnej
|
||||||
- wartość $y$ jest zawsze równa $b_0$
|
- testowania normalności rozkładu
|
||||||
|
|
||||||
Ujemna wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
|
Funkcja `lillie.test` służy do:
|
||||||
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $|b_1|$
|
- testowania równości średnich dwóch populacji
|
||||||
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
|
-| testowania normalności rozkładu
|
||||||
- zmienna $x$ nie ma żadnego wpływu na $y$
|
- testowania niezależności zmiennych w tablicy kontyngencji
|
||||||
|
|
||||||
Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ obliczamy jako:
|
W celu zbadania liniowej zależności między dwiema zmiennymi ilościowymi można zastosować:
|
||||||
-| $F(b)-F(a)$
|
- test Spearmana wyłącznie dla danych nominalnych
|
||||||
- $f(b)-f(a)$
|
-| test Pearsona
|
||||||
- $F(a)-F(b)$
|
- test Kruskala-Wallisa
|
||||||
|
|
||||||
Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ można obliczyć jako:
|
Współczynniki liniowego modelu regresji $y=b_0+b_1x$ można wyznaczyć w R za pomocą:
|
||||||
-| $\int_a^b f(x)dx$
|
- `anova(y~x)`
|
||||||
- $\int_b^a f(x)dx$
|
-| `lm(y~x)`
|
||||||
- $f(a)+f(b)$
|
- `chisq.test(y~x)`
|
||||||
|
|
||||||
Dla zmiennej losowej wykładniczej z dystrybuantą $F(x)$ prawdopodobieństwo $P(X>a)$ wynosi:
|
Jeżeli $X_1,\ldots,X_n$ jest próbą z rozkładu normalnego o średniej $\mu$ i odchyleniu standardowym $\sigma$, to średnia z próby $\overline{X}$ ma rozkład:
|
||||||
-| $1-F(a)$
|
- $N(n\mu,\sqrt{n}\sigma)$
|
||||||
- $F(a)$
|
-| $N(\mu,\sigma/\sqrt{n})$
|
||||||
- $f(a)$
|
- $N(0,1)$
|
||||||
|
|
||||||
|
Hipotezę zerową odrzucamy na poziomie istotności $\alpha$, gdy:
|
||||||
|
- $p\text{-value}>\alpha$
|
||||||
|
-| $p\text{-value}<\alpha$
|
||||||
|
- $p\text{-value}=1-\alpha$
|
||||||
|
|||||||
1176
statystyka.md
Normal file
1176
statystyka.md
Normal file
File diff suppressed because it is too large
Load Diff
Reference in New Issue
Block a user