Update pytania.txt

2026-05-21 10:24:14 +02:00
parent 259a84c4b2
commit 36f29e27d9
1 changed files with 351 additions and 6 deletions
--- a/pytania.txt
+++ b/pytania.txt
@@ -1,7 +1,352 @@
-// Przykładowe pytanie startowe
+// Statystyka - pytania_SiAD_AI-1.pdf z dysku Informatyka 2023 pytania 1-20
 Mediana (drugi kwartyl):
 -| jest wartością środkową w zbiorze obserwacji
 - oddziela 75% swoich wyższych obserwacji od 25% swoich niższych obserwacji
 - pojawia się najczęściej wśród wszystkich obserwacji
 Rozkład prawdopodobieństwa dyskretnej zmiennej losowej może być przedstawiony:
 -| w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi prawdopodobieństwami w drugim wierszu
 - w postaci tabeli, z wartościami zmiennej losowej w pierwszym wierszu i odpowiednimi częstościami w drugim wierszu
 - jako $\int_{-\infty}^{\infty} f(x) dx$
 Która z poniższych reprezentuje statystyki?
 - proporcji populacji
 -| suma zmiennych losowych stanowiących próbę
 - średnia populacyjna
 Niech $L$ i $U$ będą funkcjami zmiennych losowych stanowiących próbkę spełniającą $P(L < \sigma^2 < U) = 0{,}9$. Następnie różnica $(U-L)$:
 -| jest długością 90% przedziału ufności dla wariancji populacji
 - z 90% ufnością obejmuje prawdziwą wartość wariancji populacji
 - jest 90% przedziałem ufności dla wariancji populacji
 Hipoteza: $H_0: \sigma^2 = 0{,}9$, $H_1: \sigma^2 \neq 0{,}9$, jest związana z testowaniem:
 -| wariancji populacji
 - poziomu istotności
 - wariancji próby
 Załóżmy, że dwie próbki są losowo wybierane z normalnie rozmieszczonych populacji. Zanim zostanie skonstruowany przedział ufności dla różnicy między środkami populacji, najpierw zweryfikujemy, czy:
 - średnie próbek są równe
 - wariancje próbek są równe
 -| wariancje populacji nie różnią się istotnie
 Załóżmy, że przeprowadzono analizę wariancji i odrzucono hipotezę zerową o równości kilku środków populacji. Następnie możemy wykonać testy post-hoc, na przykład test Tukey Honest Significant Difference. Co wywnioskujemy z takiego testu post-hoc?
 -| które ze średnich populacji są istotnie podobne/różne
 - które ze środków próbki są jednorodne/heterogeniczne
 - że populacje są/nie są normalnie rozłożone
 Załóżmy, że wartość kowariancji próbki między dwiema zmiennymi losowymi jest równa $-0{,}9$. To pokazuje, że:
 -| wzrost wartości jednej zmiennej oznacza spadek wartości drugiej zmiennej
 - istnieje bardzo silne liniowe powiązanie między dwiema zmiennymi losowymi
 - kowariancja nie może być ujemna
 Która z poniższych funkcji jest poświęcona testowaniu hipotezy o dopasowaniu rozkładu częstotliwości do konkretnego wzorca?
 -| chisq.test
 - var.test
 - t.test
 Testy nieparametryczne opierają się na:
 - statystykach skonstruowanych jako funkcje pomiarów o rozkładzie normalnym
 -| rangach obserwacji
 - graficznych ocenach obserwacji
 Na wykresie pudełkowym można zobaczyć następujące wielkości:
 - kwartyle, zakres, odchylenie standardowe
 -| zakres, minimum, pierwszy kwartyl
 - zakres, wariancja, pierwszy kwartyl
 Załóżmy, że $X$ jest zmienną losową o rozkładzie wykładniczym z parametrem $\lambda$. Prawdopodobieństwo, że $X$ jest większe od pewnego $a$, czyli $P(X > a)$, można obliczyć jako:
 - suma prawdopodobieństw związanych z wartościami całkowitymi $X$, które są większe od $a$
 - $1/\lambda$
 -| $1 - F(a)$, gdzie $F(x)$ to skumulowana dystrybuanta (CDF) zmiennej $X$
 Próba:
 - zawiera co najmniej 40 zmiennych losowych
 -| jest podzbiorem populacji
 - zazwyczaj oznaczana przez $\bar{X}$
 Niech $L$ i $U$ będą funkcjami zmiennych losowych tworzących próbkę spełniającą $P(L < \mu < U) = 0{,}99$. Wtedy z 99% pewnością przedział $(L,U)$ pokrywa prawdziwą wartość:
 - poziomu ufności
 -| średniej populacji
 - średniej próbki
 Znaczenie testu, zazwyczaj oznaczane przez $\alpha$, jest równe:
 - poziomowi ufności
 -| prawdopodobieństwu błędu I rodzaju
 - prawdopodobieństwu błędu II rodzaju
 Załóżmy, że dwie próbki są losowo wybrane z populacji o rozkładzie normalnym. Aby skonstruować przedział ufności dla różnicy średnich populacji, nie musimy weryfikować założenia o:
 - homogeniczności wariancji populacji
 - homogeniczności wariancji próbek
 -| normalności rozkładu obu populacji
 Aby przeprowadzić analizę wariancji (ANOVA) w celu przetestowania hipotezy o równości kilku średnich populacji, muszą być spełnione następujące założenia:
 - normalność rozkładu każdego leczenia i równość rozmiarów próbek
 -| normalność rozkładu każdej populacji i homogeniczność wariancji populacji
 - równość rozmiarów próbek i homogeniczność wariancji próbek
 Jeśli linia regresji ma postać $y = b_0 + b_1x$, to ujemna wartość estymacji $b_1$ pokazuje:
 - jak duża jest wartość $y$, gdy $x$ jest równy estymacji $b_1$
 - o ile wartość $y$ wzrasta, gdy $x$ maleje o estymację $b_1$
 -| o ile wartość $y$ maleje, gdy $x$ wzrasta o 1
 Która z poniższych funkcji nie jest przeznaczona do testowania normalności rozkładu?
 - Test Kołmogorowa-Lillieforsa
 - test Shapiro-Wilka
 -| test Friedmana
 Rozważmy przykład, w którym chcemy porównać dwa rozkłady, a założenie o normalności nie ma sensu, ponieważ na przykład zbieramy tylko pomiary całkowite lub rozkłady są skośne. Który test jest odpowiedni do sprawdzenia, czy rozkłady są identyczne, jeśli próbki nie są niezależne?
 - test chi-kwadrat
 -| test rang Wilcoxona
 - test Pearsona
 // Statystyka — test - II_ Przegląd próby.pdf z dysku Informatyka 2023, pytania 1–10 ze zrzutów ekranu
 Analiza wariancji (ANOVA) służy do testowania hipotezy o równości:
 -| kilku średnich populacyjnych
 - kilku średnich z próby
 - kilku wariancji populacyjnych
 Która z poniższych funkcji nie przyda się do testowania normalności rozkładu prawdopodobieństwa?
 -| sigma.test
 - shapiro.test
 - lillie.test
 Błąd I-go rodzaju popełniamy, gdy:
 - nie odrzucimy prawdziwej hipotezy zerowej
 -| odrzucimy prawdziwą hipotezę zerową
 - fałszywa hipoteza zerowa zostanie odrzucona
 Z wykresu pudełkowego nie odczytamy wartości:
 - minimum, rozstępu i rozstępu międzykwartylowego
 -| rozstępu, wariancji i pierwszego kwartyla
 - rozstępu, minimum i trzeciego kwartyla
 Niech $f(x)$ będzie funkcją gęstości prawdopodobieństwa ciągłej zmiennej losowej $X$ i niech $F(x)$ będzie jej dystrybuantą. Wówczas $P(a < X < b)$ nie może być obliczone ze wzoru:
 - $\int_a^b f(x)\,dx$
 - $F(b)-F(a)$
 -| $f(b)-f(a)$
 Załóżmy, że pobrana została $n$-elementowa próba z rozkładu normalnego ze znanym odchyleniem standardowym $\sigma$. Do oceny przedziałowej średniej populacyjnej możemy wykorzystać funkcję:
 - zsum.test wykorzystującą kwantyle rozkładu $N(0,1)$
 -| z.test wykorzystującą kwantyle rozkładu $N(0,1)$
 - t.test wykorzystującą kwantyle rozkładu t-Studenta z $n-1$ stopniami swobody
 Jeżeli $X_1,\ldots,X_n$ jest próbą z rozkładu normalnego ze średnią $\mu$ i odchyleniem standardowym $\sigma$, to suma $X_1+\cdots+X_n$:
 -| ma rozkład $N(n\mu,\sqrt{n}\sigma)$
 - ma asymptotyczny rozkład $N(\mu,\sigma/\sqrt{n})$
 - ma asymptotyczny rozkład $N(n\mu,\sqrt{n}\sigma)$
 Rozważmy eksperyment, w którym badana jest liczba niedopełnionych puszek w zależności od automatu napełniającego (jest 6 automatów). Eksperymentator zauważył, że z upływem czasu ilość napoju w puszce maleje, niezależnie od tego, który automat je napełnia. Zatem założenie o normalności rozkładu liczby niedopełnionych puszek nie ma sensu. Którego testu użyć do sprawdzenia, czy wybór automatu ma wpływ na liczbę niedopełnionych puszek?
 - ANOVA
 -| H Kruskala-Wallisa
 - testu Wilcoxona
 Jeśli równanie prostej regresji ma postać $y=b_0+b_1x$, to ujemna wartość współczynnika regresji $b_1$ informuje:
 - o ile wzrośnie wartość $y$ jeśli wartość $x$ zmaleje o $b_1$
 -| o ile zmaleje wartość $y$ jeśli wartość $x$ wzrośnie o 1
 - jaka jest wartość $y$ dla $x$ równego $b_1$
 Załóżmy, że pobrane zostały losowo dwie próby z rozkładów normalnych. Do oceny przedziałowej ilorazu wariancji populacyjnych można wykorzystać funkcję:
 - t.test
 -| var.test
 - sigma.test
 // Statystyka — pytania analogiczne / potencjalne
 Wykres dystrybuanty zmiennej losowej dyskretnej ma kształt:
 -| schodkowy
 - dzwonowy
 - liniowy bez skoków
 Dystrybuanta $F(x)$ zmiennej losowej oznacza:
 -| prawdopodobieństwo $P(X \leq x)$
 - prawdopodobieństwo $P(X = x)$
 - wartość funkcji gęstości w punkcie $x$
 Dla ciągłej zmiennej losowej dystrybuanta jest zwykle:
 -| funkcją ciągłą
 - funkcją zawsze schodkową
 - funkcją malejącą
 Dla dyskretnej zmiennej losowej dystrybuanta:
 -| może mieć skoki w punktach przyjmowanych przez zmienną losową
 - zawsze jest funkcją gęstości
 - zawsze jest linią prostą
 Statystyka to:
 -| dowolna funkcja zmiennych losowych stanowiących próbę, niezawierająca nieznanych parametrów
 - dowolna funkcja nieznanych parametrów populacji
 - wyłącznie średnia populacyjna
 Która z poniższych wielkości nie jest statystyką?
 - średnia z próby
 - suma obserwacji z próby
 -| średnia populacyjna $\mu$
 Która z poniższych wielkości jest statystyką?
 -| wariancja z próby
 - wariancja populacji $\sigma^2$
 - parametr $\lambda$ rozkładu wykładniczego
 Statystyka może być funkcją:
 -| obserwacji z próby
 - wyłącznie parametrów populacji
 - wyłącznie poziomu ufności
 Estymator jest:
 -| statystyką służącą do szacowania nieznanego parametru populacji
 - zawsze znanym parametrem populacji
 - zawsze błędem losowym
 Niech $L$ i $U$ będą statystykami spełniającymi $P(L < \theta < U)=1-\alpha$. Wtedy przedział $(L,U)$ jest:
 -| przedziałem ufności dla parametru $\theta$ na poziomie ufności $1-\alpha$
 - przedziałem predykcji dla każdej przyszłej obserwacji
 - przedziałem zawierającym zawsze wszystkie obserwacje z próby
 Jeżeli $P(L < \mu < U)=0{,}95$, to przedział $(L,U)$ jest:
 -| 95% przedziałem ufności dla średniej populacji
 - 95% przedziałem ufności dla średniej próby
 - 95% przedziałem ufności dla poziomu istotności
 W przedziale ufności dla średniej populacji $\mu$ losowe są:
 -| granice przedziału $L$ i $U$
 - parametr $\mu$
 - poziom ufności po obliczeniu przedziału
 Poziom ufności $1-\alpha$ oznacza:
 -| prawdopodobieństwo pokrycia prawdziwego parametru przez losowo skonstruowany przedział
 - prawdopodobieństwo błędu I rodzaju
 - wartość średniej populacji
 Poziom istotności $\alpha$ oznacza:
 -| prawdopodobieństwo popełnienia błędu I rodzaju
 - prawdopodobieństwo popełnienia błędu II rodzaju
 - prawdopodobieństwo przyjęcia hipotezy zerowej
 Błąd I rodzaju polega na:
 -| odrzuceniu prawdziwej hipotezy zerowej
 - nieodrzuceniu fałszywej hipotezy zerowej
 - odrzuceniu fałszywej hipotezy zerowej
 Błąd II rodzaju polega na:
 -| nieodrzuceniu fałszywej hipotezy zerowej
 - odrzuceniu prawdziwej hipotezy zerowej
 - odrzuceniu fałszywej hipotezy zerowej
 Jeżeli hipoteza zerowa jest prawdziwa, a my ją odrzucimy, to popełniamy:
 -| błąd I rodzaju
 - błąd II rodzaju
 - błąd estymacji punktowej
 Jeżeli hipoteza zerowa jest fałszywa, a my jej nie odrzucimy, to popełniamy:
 -| błąd II rodzaju
 - błąd I rodzaju
 - błąd standardowy średniej
 Wykres pudełkowy pozwala odczytać:
 -| minimum, pierwszy kwartyl, medianę, trzeci kwartyl i maksimum
 - średnią, wariancję i odchylenie standardowe
 - wyłącznie wartości odstające
 Z wykresu pudełkowego nie odczytamy bezpośrednio:
 -| wariancji
 - mediany
 - rozstępu międzykwartylowego
 Rozstęp międzykwartylowy to:
 -| różnica między trzecim a pierwszym kwartylem
 - różnica między maksimum a minimum
 - różnica między średnią a medianą
 Mediana na wykresie pudełkowym jest zazwyczaj przedstawiona jako:
 -| linia wewnątrz pudełka
 - koniec górnego wąsa
 - punkt odstający
 ANOVA służy do testowania hipotezy o równości:
 -| kilku średnich populacyjnych
 - kilku wariancji z próby
 - kilku median populacyjnych w każdej sytuacji
 Hipoteza zerowa w jednoczynnikowej analizie wariancji ANOVA mówi, że:
 -| wszystkie średnie populacyjne są równe
 - wszystkie wariancje z próby są różne
 - wszystkie populacje mają rozkład jednostajny
 Po odrzuceniu hipotezy zerowej w ANOVA możemy stwierdzić, że:
 -| co najmniej jedna średnia populacyjna różni się od pozostałych
 - wszystkie średnie populacyjne są na pewno parami różne
 - wszystkie wariancje populacyjne są równe
 Testy post-hoc po ANOVA stosuje się, aby:
 -| sprawdzić, które średnie różnią się istotnie między sobą
 - sprawdzić normalność każdej populacji
 - obliczyć dystrybuantę zmiennej losowej
 Test Tukeya jest przykładem:
 -| testu post-hoc po analizie wariancji
 - testu normalności rozkładu
 - testu zgodności chi-kwadrat
 Funkcja `shapiro.test` służy do:
 -| testowania normalności rozkładu
 - testowania równości wariancji dwóch populacji
 - testowania niezależności dwóch zmiennych jakościowych
 Funkcja `var.test` w R służy do:
 -| testowania równości wariancji dwóch populacji normalnych
 - testowania normalności rozkładu
 - testowania równości kilku średnich populacyjnych
 Funkcja `t.test` w R może służyć do:
 -| testowania hipotez dotyczących średniej
 - testowania zgodności rozkładu empirycznego z teoretycznym
 - testowania normalności rozkładu
 Funkcja `chisq.test` może służyć do:
 -| testu zgodności lub testu niezależności
 - testowania średniej populacyjnej przy znanym odchyleniu standardowym
 - testowania normalności rozkładu
 Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem:
 -| jednoczynnikowej analizy wariancji ANOVA
 - testu Shapiro-Wilka
 - testu F dla wariancji
 Test Wilcoxona stosuje się między innymi, gdy:
 -| porównujemy rozkłady bez zakładania normalności
 - zawsze znamy wariancję populacji
 - badamy wyłącznie zmienne nominalne
 Kowariancja ujemna oznacza, że:
 -| wzrostowi jednej zmiennej zwykle towarzyszy spadek drugiej zmiennej
 - zmienne nie mogą być ze sobą powiązane
 - obie zmienne zawsze mają rozkład normalny
 Dodatnia wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
 -| gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
 - gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $b_1$
 - wartość $y$ jest zawsze równa $b_0$
 Ujemna wartość współczynnika regresji $b_1$ w modelu $y=b_0+b_1x$ oznacza, że:
 -| gdy $x$ wzrasta o 1, przewidywana wartość $y$ maleje o $|b_1|$
 - gdy $x$ wzrasta o 1, przewidywana wartość $y$ wzrasta o $b_1$
 - zmienna $x$ nie ma żadnego wpływu na $y$
 Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ obliczamy jako:
 -| $F(b)-F(a)$
 - $f(b)-f(a)$
 - $F(a)-F(b)$
 Dla zmiennej losowej ciągłej prawdopodobieństwo $P(a<X<b)$ można obliczyć jako:
 -| $\int_a^b f(x)dx$
 - $\int_b^a f(x)dx$
 - $f(a)+f(b)$
 Dla zmiennej losowej wykładniczej z dystrybuantą $F(x)$ prawdopodobieństwo $P(X>a)$ wynosi:
 -| $1-F(a)$
 - $F(a)$
 - $f(a)$
 Która miara statystyczna opisuje przeciętną wartość obserwacji w próbie?
 - Mediana
 - Wariancja
 -| Średnia arytmetyczna
 - Odchylenie standardowe