Update baza

This commit is contained in:
2026-06-20 23:08:56 +02:00
parent 066158aa9b
commit ac7416b1ac
2 changed files with 1314 additions and 131 deletions

View File

@@ -10,11 +10,6 @@ Rozkład prawdopodobieństwa dyskretnej zmiennej losowej może być przedstawion
- w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu - w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu
- jako $\int_{-\infty}^{\infty} f(x) dx$ - jako $\int_{-\infty}^{\infty} f(x) dx$
Która z poniższych reprezentuje statystyki?
- proporcji populacji
-| suma zmiennych losowych stanowiących próbę
- średnia populacyjna
Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$: Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$:
-| jest długością 90% przedziału ufności dla wariancji populacji -| jest długością 90% przedziału ufności dla wariancji populacji
- z 90% ufnością obejmuje prawdziwą wartość wariancji populacji - z 90% ufnością obejmuje prawdziwą wartość wariancji populacji
@@ -40,11 +35,6 @@ Załóżmy, że wartość kowariancji próbki między dwiema zmiennymi losowymi
- istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi - istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi
- kowariancja nie może być ujemna - kowariancja nie może być ujemna
Która z poniższych funkcji jest poświęcona testowaniu hipotezy o dopasowaniu rozkładu częstotliwości do konkretnego wzorca?
-| chisq.test
- var.test
- t.test
Testy nieparametryczne opierają się na: Testy nieparametryczne opierają się na:
- statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym - statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym
-| rangach obserwacji -| rangach obserwacji
@@ -85,11 +75,6 @@ Aby przeprowadzić analizę wariancji (ANOVA) w celu przetestowania hipotezy o r
-| normalność rozkładu każdej populacji i homogeniczność wariancji populacji -| normalność rozkładu każdej populacji i homogeniczność wariancji populacji
- równość rozmiarów próbek i homogeniczność wariancji próbek - równość rozmiarów próbek i homogeniczność wariancji próbek
Jeśli linia regresji ma postać $y = b_0 + b_1x$, to ujemna wartość estymacji $b_1$ pokazuje:
- jak duża jest wartość $y$, gdy $x$ jest równy estymacji $b_1$
- o ile wartość $y$ wzrasta, gdy $x$ maleje o estymację $b_1$
-| o ile wartość $y$ maleje, gdy $x$ wzrasta o 1
Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu? Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu?
- Test Kołmogorowa-Lillieforsa - Test Kołmogorowa-Lillieforsa
- test Shapiro-Wilka - test Shapiro-Wilka
@@ -142,16 +127,117 @@ Rozważmy eksperyment, w którym badana jest liczba niedopełnionych puszek w za
-| H Kruskala-Wallisa -| H Kruskala-Wallisa
- testu Wilcoxona - testu Wilcoxona
Jeśli równanie prostej regresji ma postać $y=b_0+b_1x$, to ujemna wartość współczynnika regresji $b_1$ informuje:
- o ile wzrośnie wartość $y$ jeśli wartość $x$ zmaleje o $b_1$
-| o ile zmaleje wartość $y$ jeśli wartość $x$ wzrośnie o 1
- jaka jest wartość $y$ dla $x$ równego $b_1$
Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję: Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję:
- t.test - t.test
-| var.test -| var.test
- sigma.test - sigma.test
// Statystyka — brakujące pytania ze statystyka.md
Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej jest:
- dowolną funkcją przyjmującą wartości z przedziału od 0 do 1
- dowolną funkcją ciągłą, dla której pole pod wykresem wynosi 1
-| dowolną funkcją nieujemną, dla której pole pod wykresem wynosi 1
Zbiór wartości, który z prawdopodobieństwem $1-\alpha$ pokrywa prawdziwą wartość nieznanego parametru populacji, to:
- obszar krytyczny
- poziom ufności
-| przedział ufności
Do testowania hipotezy o normalności rozkładu populacji można użyć:
- funkcji `zsum.test`, jeśli próba jest duża
-| funkcji `chisq.test` po odpowiednim pogrupowaniu danych
- funkcji `z.test`, jeśli odchylenie standardowe populacji jest znane
Jeśli te same osoby rozwiązują kilka zadań w losowej kolejności i chcemy porównać rozkłady czasów ich rozwiązywania, użyjemy:
- testu Spearmana
-| testu Friedmana
- testu Kruskala-Wallisa
Konstruując szereg rozdzielczy lub histogram, należy zadbać, aby przedziały:
- mogły się nakładać, o ile nie są puste
- nie musiały pokrywać wszystkich wartości
-| były rozłączne i pokrywały cały zbiór wartości
Do weryfikacji hipotezy o dwóch średnich populacyjnych nie użyjemy:
- funkcji `zsum.test`, gdy próby są duże i nie pochodzą z rozkładu normalnego
-| funkcji `var.test`
- funkcji `t.test`, gdy próby pochodzą z rozkładu normalnego
Notacja $H_0:\mu \geq 5$, $H_1:\mu < 5$ opisuje:
- hipotezę lewostronną o średniej z próby
- hipotezę prawostronną o średniej populacyjnej
-| hipotezę lewostronną o średniej populacyjnej
Testu chi-kwadrat nie użyjemy bezpośrednio do testowania:
- niezależności dwóch zmiennych w tablicy kontyngencji
- równości dwóch proporcji populacyjnych
-| normalności rozkładu populacji
Moda (dominanta):
- oddziela 75% większych obserwacji od 25% mniejszych obserwacji
-| występuje najczęściej w zbiorze obserwacji
- jest wartością środkową w zbiorze obserwacji
Estymatorów współczynników równania regresji nie wyznaczymy za pomocą:
- metody najmniejszych kwadratów
- funkcji `lm(y~x)`
-| funkcji `anova(y~x)`
W analizie wariancji nie odrzucimy hipotezy zerowej, gdy wartość statystyki testowej jest:
- niższa od odpowiedniego kwantyla rozkładu t-Studenta
- niższa od odpowiedniego kwantyla rozkładu chi-kwadrat
-| niższa od odpowiedniego kwantyla rozkładu F-Snedecora
Jeżeli $X_1,\ldots,X_n$ jest dużą próbą z rozkładu o wartości oczekiwanej $\mu$ i odchyleniu standardowym $\sigma$, to suma $X_1+\cdots+X_n$ ma asymptotyczny rozkład:
- $N(\mu,\sigma/\sqrt{n})$
-| $N(n\mu,\sqrt{n}\sigma)$
- $N(0,1)$
Hipotezę zerową odrzucamy, gdy:
-| wartość statystyki testowej należy do obszaru krytycznego
- wartość statystyki testowej należy do przedziału ufności
- poziom istotności jest niższy niż p-value
Do weryfikacji hipotezy o dwóch proporcjach populacyjnych można wykorzystać funkcję:
- `t.test`
- `binom.test`
-| `prop.test`
Jeżeli $(L,U)$ jest 95% przedziałem ufności dla odchylenia standardowego populacji, to z ufnością 95% przedział ten:
- pokrywa prawdziwą wartość średniej populacyjnej
- pokrywa prawdziwą wartość odchylenia standardowego z próby
-| pokrywa prawdziwą wartość odchylenia standardowego populacji
Dodatnia wartość kowariancji między zmiennymi $X$ i $Y$ oznacza, że:
-| gdy wartość $X$ rośnie, wartość $Y$ zwykle również rośnie
- wartość $Y$ rośnie o wartość kowariancji, gdy $X$ rośnie o 1
- gdy wartość $X$ rośnie, wartość $Y$ maleje
Ujemna wartość współczynnika korelacji między zmiennymi $X$ i $Y$ oznacza, że:
- współczynnik korelacji nie może być ujemny
- wartość $Y$ maleje dokładnie o wartość współczynnika korelacji, gdy $X$ rośnie o 1
-| gdy wartość $X$ rośnie, wartość $Y$ zwykle maleje
Jeżeli chcemy sprawdzić, czy kolor samochodu wpływa na średnią sprzedaż danego modelu, a dostępne są co najmniej trzy kolory, najrozsądniej jest:
- przeprowadzić test chi-kwadrat równości dwóch wariancji
-| przeprowadzić analizę wariancji
- użyć `t.test` do porównania dwóch średnich
Gdy dwóch ekspertów sporządza rankingi tych samych tancerzy, do sprawdzenia zgodności ich opinii użyjemy:
- testu Pearsona
-| testu Spearmana
- testu Wilcoxona
Niech dyskretna zmienna losowa $X$ przyjmuje wartości $x_1<x_2<x_3$ z prawdopodobieństwami odpowiednio $p_1,p_2,p_3$. Wtedy $P(X=x_2)$ wynosi:
- $p_1$
- 0
-| $p_2$
Jeżeli $y=b_0+b_1x$ jest równaniem prostej regresji, to w teście istotności regresji hipoteza alternatywna ma postać:
- $\rho_{XY}=0$
-| $b_1\neq 0$
- $b_0\neq 0$
// Statystyka — pytania analogiczne / potencjalne // Statystyka — pytania analogiczne / potencjalne
@@ -170,15 +256,10 @@ Dla ciągłej zmiennej losowej dystrybuanta jest zwykle:
- funkcją zawsze schodkową - funkcją zawsze schodkową
- funkcją malejącą - funkcją malejącą
Dla dyskretnej zmiennej losowej dystrybuanta:
-| może mieć skoki w punktach przyjmowanych przez zmienną losową
- zawsze jest funkcją gęstości
- zawsze jest linią prostą
Statystyka to: Statystyka to:
-| dowolna funkcja zmiennych losowych stanowiących próbę, niezawierająca nieznanych parametrów -| dowolna funkcja zmiennych losowych stanowiących próbę
- dowolna funkcja nieznanych parametrów populacji - dowolna funkcja parametrów populacji
- wyłącznie średnia populacyjna - średnia populacyjna
Która z poniższych wielkości nie jest statystyką? Która z poniższych wielkości nie jest statystyką?
- średnia z próby - średnia z próby
@@ -190,26 +271,6 @@ Która z poniższych wielkości jest statystyką?
- wariancja populacji $\sigma^2$ - wariancja populacji $\sigma^2$
- parametr $\lambda$ rozkładu wykładniczego - parametr $\lambda$ rozkładu wykładniczego
Statystyka może być funkcją:
-| obserwacji z próby
- wyłącznie parametrów populacji
- wyłącznie poziomu ufności
Estymator jest:
-| statystyką służącą do szacowania nieznanego parametru populacji
- zawsze znanym parametrem populacji
- zawsze błędem losowym
Niech $L$ i $U$ będą statystykami spełniającymi $P(L < \theta < U)=1-\alpha$. Wtedy przedział $(L,U)$ jest:
-| przedziałem ufności dla parametru $\theta$ na poziomie ufności $1-\alpha$
- przedziałem predykcji dla każdej przyszłej obserwacji
- przedziałem zawierającym zawsze wszystkie obserwacje z próby
Jeżeli $P(L < \mu < U)=0{,}95$, to przedział $(L,U)$ jest:
-| 95% przedziałem ufności dla średniej populacji
- 95% przedziałem ufności dla średniej próby
- 95% przedziałem ufności dla poziomu istotności
W przedziale ufności dla średniej populacji $\mu$ losowe są: W przedziale ufności dla średniej populacji $\mu$ losowe są:
-| granice przedziału $L$ i $U$ -| granice przedziału $L$ i $U$
- parametr $\mu$ - parametr $\mu$
@@ -220,41 +281,16 @@ Poziom ufności $1-\alpha$ oznacza:
- prawdopodobieństwo błędu I rodzaju - prawdopodobieństwo błędu I rodzaju
- wartość średniej populacji - wartość średniej populacji
Poziom istotności $\alpha$ oznacza:
-| prawdopodobieństwo popełnienia błędu I rodzaju
- prawdopodobieństwo popełnienia błędu II rodzaju
- prawdopodobieństwo przyjęcia hipotezy zerowej
Błąd I rodzaju polega na:
-| odrzuceniu prawdziwej hipotezy zerowej
- nieodrzuceniu fałszywej hipotezy zerowej
- odrzuceniu fałszywej hipotezy zerowej
Błąd II rodzaju polega na: Błąd II rodzaju polega na:
-| nieodrzuceniu fałszywej hipotezy zerowej -| nieodrzuceniu fałszywej hipotezy zerowej
- odrzuceniu prawdziwej hipotezy zerowej - odrzuceniu prawdziwej hipotezy zerowej
- odrzuceniu fałszywej hipotezy zerowej - odrzuceniu fałszywej hipotezy zerowej
Jeżeli hipoteza zerowa jest prawdziwa, a my ją odrzucimy, to popełniamy:
-| błąd I rodzaju
- błąd II rodzaju
- błąd estymacji punktowej
Jeżeli hipoteza zerowa jest fałszywa, a my jej nie odrzucimy, to popełniamy:
-| błąd II rodzaju
- błąd I rodzaju
- błąd standardowy średniej
Wykres pudełkowy pozwala odczytać: Wykres pudełkowy pozwala odczytać:
-| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum -| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum
- średnią, wariancję i odchylenie standardowe - średnią, wariancję i odchylenie standardowe
- wyłącznie wartości odstające - wyłącznie wartości odstające
Z wykresu pudełkowego nie odczytamy bezpośrednio:
-| wariancji
- mediany
- rozstępu międzykwartylowego
Rozstęp międzykwartylowy to: Rozstęp międzykwartylowy to:
-| różnica między trzecim a pierwszym kwartylem -| różnica między trzecim a pierwszym kwartylem
- różnica między maksimum a minimum - różnica między maksimum a minimum
@@ -265,21 +301,6 @@ Mediana na wykresie pudełkowym jest zazwyczaj przedstawiona jako:
- koniec górnego wąsa - koniec górnego wąsa
- punkt odstający - punkt odstający
ANOVA służy do testowania hipotezy o równości:
-| kilku średnich populacyjnych
- kilku wariancji z próby
- kilku median populacyjnych w każdej sytuacji
Hipoteza zerowa w jednoczynnikowej analizie wariancji ANOVA mówi, że:
-| wszystkie średnie populacyjne są równe
- wszystkie wariancje z próby są różne
- wszystkie populacje mają rozkład jednostajny
Po odrzuceniu hipotezy zerowej w ANOVA możemy stwierdzić, że:
-| co najmniej jedna średnia populacyjna różni się od pozostałych
- wszystkie średnie populacyjne są na pewno parami różne
- wszystkie wariancje populacyjne są równe
Testy post-hoc po ANOVA stosuje się, aby: Testy post-hoc po ANOVA stosuje się, aby:
-| sprawdzić, które średnie różnią się istotnie między sobą -| sprawdzić, które średnie różnią się istotnie między sobą
- sprawdzić normalność każdej populacji - sprawdzić normalność każdej populacji
@@ -295,58 +316,44 @@ Funkcja `shapiro.test` służy do:
- testowania równości wariancji dwóch populacji - testowania równości wariancji dwóch populacji
- testowania niezależności dwóch zmiennych jakościowych - testowania niezależności dwóch zmiennych jakościowych
Funkcja `var.test` w R służy do:
-| testowania równości wariancji dwóch populacji normalnych
- testowania normalności rozkładu
- testowania równości kilku średnich populacyjnych
Funkcja `t.test` w R może służyć do:
-| testowania hipotez dotyczących średniej
- testowania zgodności rozkładu empirycznego z teoretycznym
- testowania normalności rozkładu
Funkcja `chisq.test` może służyć do:
-| testu zgodności lub testu niezależności
- testowania średniej populacyjnej przy znanym odchyleniu standardowym
- testowania normalności rozkładu
Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem: Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem:
-| jednoczynnikowej analizy wariancji ANOVA -| jednoczynnikowej analizy wariancji ANOVA
- testu Shapiro-Wilka - testu Shapiro-Wilka
- testu F dla wariancji - testu F dla wariancji
Test Wilcoxona stosuje się między innymi, gdy: // Statystyka — uzupełnienie brakujących poprawnych odpowiedzi
-| porównujemy rozkłady bez zakładania normalności
- zawsze znamy wariancję populacji
- badamy wyłącznie zmienne nominalne
Kowariancja ujemna oznacza, że: Do testowania hipotezy o dwóch średnich populacyjnych dla dużych prób można wykorzystać funkcję:
-| wzrostowi jednej zmiennej zwykle towarzyszy spadek drugiej zmiennej - `t.test`
- zmienne nie mogą być ze sobą powiązane -| `zsum.test`
- obie zmienne zawsze mają rozkład normalny - `var.test`
Dodatnia wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że: Funkcja `binom.test` w R służy między innymi do:
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$ - testowania równości wariancji dwóch populacji
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $b_1$ -| testowania hipotezy o jednej proporcji populacyjnej
- wartość $y$ jest zawsze równa $b_0$ - testowania normalności rozkładu
Ujemna wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że: Funkcja `lillie.test` służy do:
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $|b_1|$ - testowania równości średnich dwóch populacji
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$ -| testowania normalności rozkładu
- zmienna $x$ nie ma żadnego wpływu na $y$ - testowania niezależności zmiennych w tablicy kontyngencji
Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ obliczamy jako: W celu zbadania liniowej zależności między dwiema zmiennymi ilościowymi można zastosować:
-| $F(b)-F(a)$ - test Spearmana wyłącznie dla danych nominalnych
- $f(b)-f(a)$ -| test Pearsona
- $F(a)-F(b)$ - test Kruskala-Wallisa
Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ można obliczyć jako: Współczynniki liniowego modelu regresji $y=b_0+b_1x$ można wyznaczyć w R za pomocą:
-| $\int_a^b f(x)dx$ - `anova(y~x)`
- $\int_b^a f(x)dx$ -| `lm(y~x)`
- $f(a)+f(b)$ - `chisq.test(y~x)`
Dla zmiennej losowej wykładniczej z dystrybuantą $F(x)$ prawdopodobieństwo $P(X>a)$ wynosi: Jeżeli $X_1,\ldots,X_n$ jest próbą z rozkładu normalnego o średniej $\mu$ i odchyleniu standardowym $\sigma$, to średnia z próby $\overline{X}$ ma rozkład:
-| $1-F(a)$ - $N(n\mu,\sqrt{n}\sigma)$
- $F(a)$ -| $N(\mu,\sigma/\sqrt{n})$
- $f(a)$ - $N(0,1)$
Hipotezę zerową odrzucamy na poziomie istotności $\alpha$, gdy:
- $p\text{-value}>\alpha$
-| $p\text{-value}<\alpha$
- $p\text{-value}=1-\alpha$

1176
statystyka.md Normal file

File diff suppressed because it is too large Load Diff