Update baza

2026-06-20 23:08:56 +02:00
parent 066158aa9b
commit ac7416b1ac
2 changed files with 1314 additions and 131 deletions
--- a/pytania.txt
+++ b/pytania.txt
@@ -10,11 +10,6 @@ Rozkład prawdopodobieństwa dyskretnej zmiennej losowej może być przedstawion
 - w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu
 - jako $\int_{-\infty}^{\infty} f(x) dx$
 Która z poniższych reprezentuje statystyki?
 - proporcji populacji
 -| suma zmiennych losowych stanowiących próbę
 - średnia populacyjna
 Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$:
 -| jest długością 90% przedziału ufności dla wariancji populacji
 - z 90% ufnością obejmuje prawdziwą wartość wariancji populacji
@@ -40,11 +35,6 @@ Załóżmy, że wartość kowariancji próbki między dwiema zmiennymi losowymi
 - istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi
 - kowariancja nie może być ujemna
 Która z poniższych funkcji jest poświęcona testowaniu hipotezy o dopasowaniu rozkładu częstotliwości do konkretnego wzorca?
 -| chisq.test
 - var.test
 - t.test
 Testy nieparametryczne opierają się na:
 - statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym
 -| rangach obserwacji
@@ -85,11 +75,6 @@ Aby przeprowadzić analizę wariancji (ANOVA) w celu przetestowania hipotezy o r
 -| normalność rozkładu każdej populacji i homogeniczność wariancji populacji
 - równość rozmiarów próbek i homogeniczność wariancji próbek
 Jeśli linia regresji ma postać $y = b_0 + b_1x$, to ujemna wartość estymacji $b_1$ pokazuje:
 - jak duża jest wartość $y$, gdy $x$ jest równy estymacji $b_1$
 - o ile wartość $y$ wzrasta, gdy $x$ maleje o estymację $b_1$
 -| o ile wartość $y$ maleje, gdy $x$ wzrasta o 1
 Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu?
 - Test Kołmogorowa-Lillieforsa
 - test Shapiro-Wilka
@@ -142,16 +127,117 @@ Rozważmy eksperyment, w którym badana jest liczba niedopełnionych puszek w za
 -| H Kruskala-Wallisa
 - testu Wilcoxona
 Jeśli równanie prostej regresji ma postać $y=b_0+b_1x$, to ujemna wartość współczynnika regresji $b_1$ informuje:
 - o ile wzrośnie wartość $y$ jeśli wartość $x$ zmaleje o $b_1$
 -| o ile zmaleje wartość $y$ jeśli wartość $x$ wzrośnie o 1
 - jaka jest wartość $y$ dla $x$ równego $b_1$
 Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję:
 - t.test
 -| var.test
 - sigma.test
 // Statystyka — brakujące pytania ze statystyka.md
 Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej jest:
 - dowolną funkcją przyjmującą wartości z przedziału od 0 do 1
 - dowolną funkcją ciągłą, dla której pole pod wykresem wynosi 1
 -| dowolną funkcją nieujemną, dla której pole pod wykresem wynosi 1
 Zbiór wartości, który z prawdopodobieństwem $1-\alpha$ pokrywa prawdziwą wartość nieznanego parametru populacji, to:
 - obszar krytyczny
 - poziom ufności
 -| przedział ufności
 Do testowania hipotezy o normalności rozkładu populacji można użyć:
 - funkcji `zsum.test`, jeśli próba jest duża
 -| funkcji `chisq.test` po odpowiednim pogrupowaniu danych
 - funkcji `z.test`, jeśli odchylenie standardowe populacji jest znane
 Jeśli te same osoby rozwiązują kilka zadań w losowej kolejności i chcemy porównać rozkłady czasów ich rozwiązywania, użyjemy:
 - testu Spearmana
 -| testu Friedmana
 - testu Kruskala-Wallisa
 Konstruując szereg rozdzielczy lub histogram, należy zadbać, aby przedziały:
 - mogły się nakładać, o ile nie są puste
 - nie musiały pokrywać wszystkich wartości
 -| były rozłączne i pokrywały cały zbiór wartości
 Do weryfikacji hipotezy o dwóch średnich populacyjnych nie użyjemy:
 - funkcji `zsum.test`, gdy próby są duże i nie pochodzą z rozkładu normalnego
 -| funkcji `var.test`
 - funkcji `t.test`, gdy próby pochodzą z rozkładu normalnego
 Notacja $H_0:\mu \geq 5$, $H_1:\mu < 5$ opisuje:
 - hipotezę lewostronną o średniej z próby
 - hipotezę prawostronną o średniej populacyjnej
 -| hipotezę lewostronną o średniej populacyjnej
 Testu chi-kwadrat nie użyjemy bezpośrednio do testowania:
 - niezależności dwóch zmiennych w tablicy kontyngencji
 - równości dwóch proporcji populacyjnych
 -| normalności rozkładu populacji
 Moda (dominanta):
 - oddziela 75% większych obserwacji od 25% mniejszych obserwacji
 -| występuje najczęściej w zbiorze obserwacji
 - jest wartością środkową w zbiorze obserwacji
 Estymatorów współczynników równania regresji nie wyznaczymy za pomocą:
 - metody najmniejszych kwadratów
 - funkcji `lm(y~x)`
 -| funkcji `anova(y~x)`
 W analizie wariancji nie odrzucimy hipotezy zerowej, gdy wartość statystyki testowej jest:
 - niższa od odpowiedniego kwantyla rozkładu t-Studenta
 - niższa od odpowiedniego kwantyla rozkładu chi-kwadrat
 -| niższa od odpowiedniego kwantyla rozkładu F-Snedecora
 Jeżeli $X_1,\ldots,X_n$ jest dużą próbą z rozkładu o wartości oczekiwanej $\mu$ i odchyleniu standardowym $\sigma$, to suma $X_1+\cdots+X_n$ ma asymptotyczny rozkład:
 - $N(\mu,\sigma/\sqrt{n})$
 -| $N(n\mu,\sqrt{n}\sigma)$
 - $N(0,1)$
 Hipotezę zerową odrzucamy, gdy:
 -| wartość statystyki testowej należy do obszaru krytycznego
 - wartość statystyki testowej należy do przedziału ufności
 - poziom istotności jest niższy niż p-value
 Do weryfikacji hipotezy o dwóch proporcjach populacyjnych można wykorzystać funkcję:
 - `t.test`
 - `binom.test`
 -| `prop.test`
 Jeżeli $(L,U)$ jest 95% przedziałem ufności dla odchylenia standardowego populacji, to z ufnością 95% przedział ten:
 - pokrywa prawdziwą wartość średniej populacyjnej
 - pokrywa prawdziwą wartość odchylenia standardowego z próby
 -| pokrywa prawdziwą wartość odchylenia standardowego populacji
 Dodatnia wartość kowariancji między zmiennymi $X$ i $Y$ oznacza, że:
 -| gdy wartość $X$ rośnie, wartość $Y$ zwykle również rośnie
 - wartość $Y$ rośnie o wartość kowariancji, gdy $X$ rośnie o 1
 - gdy wartość $X$ rośnie, wartość $Y$ maleje
 Ujemna wartość współczynnika korelacji między zmiennymi $X$ i $Y$ oznacza, że:
 - współczynnik korelacji nie może być ujemny
 - wartość $Y$ maleje dokładnie o wartość współczynnika korelacji, gdy $X$ rośnie o 1
 -| gdy wartość $X$ rośnie, wartość $Y$ zwykle maleje
 Jeżeli chcemy sprawdzić, czy kolor samochodu wpływa na średnią sprzedaż danego modelu, a dostępne są co najmniej trzy kolory, najrozsądniej jest:
 - przeprowadzić test chi-kwadrat równości dwóch wariancji
 -| przeprowadzić analizę wariancji
 - użyć `t.test` do porównania dwóch średnich
 Gdy dwóch ekspertów sporządza rankingi tych samych tancerzy, do sprawdzenia zgodności ich opinii użyjemy:
 - testu Pearsona
 -| testu Spearmana
 - testu Wilcoxona
 Niech dyskretna zmienna losowa $X$ przyjmuje wartości $x_1<x_2<x_3$ z prawdopodobieństwami odpowiednio $p_1,p_2,p_3$. Wtedy $P(X=x_2)$ wynosi:
 - $p_1$
 - 0
 -| $p_2$
 Jeżeli $y=b_0+b_1x$ jest równaniem prostej regresji, to w teście istotności regresji hipoteza alternatywna ma postać:
 - $\rho_{XY}=0$
 -| $b_1\neq 0$
 - $b_0\neq 0$
 // Statystyka — pytania analogiczne / potencjalne
@@ -170,15 +256,10 @@ Dla ciągłej zmiennej losowej dystrybuanta jest zwykle:
 - funkcją zawsze schodkową
 - funkcją malejącą
 Dla dyskretnej zmiennej losowej dystrybuanta:
 -| może mieć skoki w punktach przyjmowanych przez zmienną losową
 - zawsze jest funkcją gęstości
 - zawsze jest linią prostą
 Statystyka to:
-| dowolna funkcja zmiennych losowych stanowiących próbę, niezawierająca nieznanych parametrów
+-| dowolna funkcja zmiennych losowych stanowiących próbę
- dowolna funkcja nieznanych parametrów populacji
+- dowolna funkcja parametrów populacji
- wyłącznie średnia populacyjna
+- średnia populacyjna
 Która z poniższych wielkości nie jest statystyką?
 - średnia z próby
@@ -190,26 +271,6 @@ Która z poniższych wielkości jest statystyką?
 - wariancja populacji $\sigma^2$
 - parametr $\lambda$ rozkładu wykładniczego
 Statystyka może być funkcją:
 -| obserwacji z próby
 - wyłącznie parametrów populacji
 - wyłącznie poziomu ufności
 Estymator jest:
 -| statystyką służącą do szacowania nieznanego parametru populacji
 - zawsze znanym parametrem populacji
 - zawsze błędem losowym
 Niech $L$ i $U$ będą statystykami spełniającymi $P(L < \theta < U)=1-\alpha$. Wtedy przedział $(L,U)$ jest:
 -| przedziałem ufności dla parametru $\theta$ na poziomie ufności $1-\alpha$
 - przedziałem predykcji dla każdej przyszłej obserwacji
 - przedziałem zawierającym zawsze wszystkie obserwacje z próby
 Jeżeli $P(L < \mu < U)=0{,}95$, to przedział $(L,U)$ jest:
 -| 95% przedziałem ufności dla średniej populacji
 - 95% przedziałem ufności dla średniej próby
 - 95% przedziałem ufności dla poziomu istotności
 W przedziale ufności dla średniej populacji $\mu$ losowe są:
 -| granice przedziału $L$ i $U$
 - parametr $\mu$
@@ -220,41 +281,16 @@ Poziom ufności $1-\alpha$ oznacza:
 - prawdopodobieństwo błędu I rodzaju
 - wartość średniej populacji
 Poziom istotności $\alpha$ oznacza:
 -| prawdopodobieństwo popełnienia błędu I rodzaju
 - prawdopodobieństwo popełnienia błędu II rodzaju
 - prawdopodobieństwo przyjęcia hipotezy zerowej
 Błąd I rodzaju polega na:
 -| odrzuceniu prawdziwej hipotezy zerowej
 - nieodrzuceniu fałszywej hipotezy zerowej
 - odrzuceniu fałszywej hipotezy zerowej
 Błąd II rodzaju polega na:
 -| nieodrzuceniu fałszywej hipotezy zerowej
 - odrzuceniu prawdziwej hipotezy zerowej
 - odrzuceniu fałszywej hipotezy zerowej
 Jeżeli hipoteza zerowa jest prawdziwa, a my ją odrzucimy, to popełniamy:
 -| błąd I rodzaju
 - błąd II rodzaju
 - błąd estymacji punktowej
 Jeżeli hipoteza zerowa jest fałszywa, a my jej nie odrzucimy, to popełniamy:
 -| błąd II rodzaju
 - błąd I rodzaju
 - błąd standardowy średniej
 Wykres pudełkowy pozwala odczytać:
 -| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum
 - średnią, wariancję i odchylenie standardowe
 - wyłącznie wartości odstające
 Z wykresu pudełkowego nie odczytamy bezpośrednio:
 -| wariancji
 - mediany
 - rozstępu międzykwartylowego
 Rozstęp międzykwartylowy to:
 -| różnica między trzecim a pierwszym kwartylem
 - różnica między maksimum a minimum
@@ -265,21 +301,6 @@ Mediana na wykresie pudełkowym jest zazwyczaj przedstawiona jako:
 - koniec górnego wąsa
 - punkt odstający
 ANOVA służy do testowania hipotezy o równości:
 -| kilku średnich populacyjnych
 - kilku wariancji z próby
 - kilku median populacyjnych w każdej sytuacji
 Hipoteza zerowa w jednoczynnikowej analizie wariancji ANOVA mówi, że:
 -| wszystkie średnie populacyjne są równe
 - wszystkie wariancje z próby są różne
 - wszystkie populacje mają rozkład jednostajny
 Po odrzuceniu hipotezy zerowej w ANOVA możemy stwierdzić, że:
 -| co najmniej jedna średnia populacyjna różni się od pozostałych
 - wszystkie średnie populacyjne są na pewno parami różne
 - wszystkie wariancje populacyjne są równe
 Testy post-hoc po ANOVA stosuje się, aby:
 -| sprawdzić, które średnie różnią się istotnie między sobą
 - sprawdzić normalność każdej populacji
@@ -295,58 +316,44 @@ Funkcja `shapiro.test` służy do:
 - testowania równości wariancji dwóch populacji
 - testowania niezależności dwóch zmiennych jakościowych
 Funkcja `var.test` w R służy do:
 -| testowania równości wariancji dwóch populacji normalnych
 - testowania normalności rozkładu
 - testowania równości kilku średnich populacyjnych
 Funkcja `t.test` w R może służyć do:
 -| testowania hipotez dotyczących średniej
 - testowania zgodności rozkładu empirycznego z teoretycznym
 - testowania normalności rozkładu
 Funkcja `chisq.test` może służyć do:
 -| testu zgodności lub testu niezależności
 - testowania średniej populacyjnej przy znanym odchyleniu standardowym
 - testowania normalności rozkładu
 Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem:
 -| jednoczynnikowej analizy wariancji ANOVA
 - testu Shapiro-Wilka
 - testu F dla wariancji
-Test Wilcoxona stosuje się między innymi, gdy:
+// Statystyka — uzupełnienie brakujących poprawnych odpowiedzi
 -| porównujemy rozkłady bez zakładania normalności
 - zawsze znamy wariancję populacji
 - badamy wyłącznie zmienne nominalne
-Kowariancja ujemna oznacza, że:
+Do testowania hipotezy o dwóch średnich populacyjnych dla dużych prób można wykorzystać funkcję:
-| wzrostowi jednej zmiennej zwykle towarzyszy spadek drugiej zmiennej
+- `t.test`
- zmienne nie mogą być ze sobą powiązane
+-| `zsum.test`
- obie zmienne zawsze mają rozkład normalny
+- `var.test`
-Dodatnia wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
+Funkcja `binom.test` w R służy między innymi do:
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
+- testowania równości wariancji dwóch populacji
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $b_1$
+-| testowania hipotezy o jednej proporcji populacyjnej
- wartość $y$ jest zawsze równa $b_0$
+- testowania normalności rozkładu
-Ujemna wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
+Funkcja `lillie.test` służy do:
-| gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $|b_1|$
+- testowania równości średnich dwóch populacji
- gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
+-| testowania normalności rozkładu
- zmienna $x$ nie ma żadnego wpływu na $y$
+- testowania niezależności zmiennych w tablicy kontyngencji
-Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ obliczamy jako:
+W celu zbadania liniowej zależności między dwiema zmiennymi ilościowymi można zastosować:
-| $F(b)-F(a)$
+- test Spearmana wyłącznie dla danych nominalnych
- $f(b)-f(a)$
+-| test Pearsona
- $F(a)-F(b)$
+- test Kruskala-Wallisa
-Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ można obliczyć jako:
+Współczynniki liniowego modelu regresji $y=b_0+b_1x$ można wyznaczyć w R za pomocą:
-| $\int_a^b f(x)dx$
+- `anova(y~x)`
- $\int_b^a f(x)dx$
+-| `lm(y~x)`
- $f(a)+f(b)$
+- `chisq.test(y~x)`
-Dla zmiennej losowej wykładniczej z dystrybuantą $F(x)$ prawdopodobieństwo $P(X>a)$ wynosi:
+Jeżeli $X_1,\ldots,X_n$ jest próbą z rozkładu normalnego o średniej $\mu$ i odchyleniu standardowym $\sigma$, to średnia z próby $\overline{X}$ ma rozkład:
-| $1-F(a)$
+- $N(n\mu,\sqrt{n}\sigma)$
- $F(a)$
+-| $N(\mu,\sigma/\sqrt{n})$
- $f(a)$
+- $N(0,1)$
 Hipotezę zerową odrzucamy na poziomie istotności $\alpha$, gdy:
 - $p\text{-value}>\alpha$
 -| $p\text{-value}<\alpha$
 - $p\text{-value}=1-\alpha$
--- a/statystyka.md
+++ b/statystyka.md