📘 QUIZ KOLOKWIUM – Analiza Danych

✅ Cały materiał + Pewniaki

>QUIZ ABCD<
Pytanie 1: Czym jest histogram?
Odpowiedź: Histogram to graficzna reprezentacja rozkładu danych liczbowych. Przedstawia, ile wartości mieści się w określonych przedziałach.
Pytanie 2: Na czym polega reguła empiryczna (trzech sigm)?
Odpowiedź: W rozkładzie normalnym: 68% danych mieści się w 1σ, 95% w 2σ, 99.7% w 3σ od średniej.
Pytanie 3: Wyjaśnij wzór Bayesa.
Odpowiedź: Wzór Bayesa służy do określania prawdopodobieństwa przyczyn na podstawie zaobserwowanych skutków: P(A|B) = P(B|A) * P(A) / P(B).
Pytanie 4: Centralne twierdzenie graniczne – wyjaśnij własnymi słowami.
Odpowiedź: Średnie z dużej liczby prób są rozłożone normalnie, niezależnie od rozkładu danych. Im większa próba, tym dokładniejsza średnia.
Pytanie 5: Czy można skonstruować 100% przedział ufności?
Odpowiedź: Nie, 100% CI oznaczałoby znajomość całej populacji – wtedy nie byłaby potrzebna estymacja.
Pytanie 6: Jak zmienia się długość przedziału ufności gdy rośnie poziom ufności?
Odpowiedź: Im wyższy poziom ufności, tym szerszy przedział (większa pewność, mniejsza precyzja).
Pytanie 7: Co to jest wartość przewidywana?
Odpowiedź: To wartość oczekiwana – średni wynik w dużej liczbie prób (nie: 'to co przewidujemy').
Pytanie 8: Podaj przykład danych o wariancji równej 0.
Odpowiedź: Przykład: 10, 10, 10 – brak zróżnicowania.
Pytanie 9: Jak zmniejszyć odchylenie standardowe o połowę?
Odpowiedź: Należy zwiększyć liczność próby czterokrotnie.
Pytanie 10: Jak zmniejszyć wariancję średnich próbek o połowę?
Odpowiedź: Zwiększyć liczność próby dwukrotnie.
Pytanie 11: Jak skrócić przedział ufności 2x?
Odpowiedź: Zwiększyć próbę 4x, ponieważ długość CI jest odwrotnie proporcjonalna do pierwiastka z n.
Pytanie 12: Co to jest eksperyment pilotażowy?
Odpowiedź: Eksperyment pilotażowy to próba wstępna, dzięki której możemy dobrać wielkość próby i sprawdzić, czy główny eksperyment ma sens i jest dobrze zaplanowany.
Pytanie 13: Jak zmienia się długość przedziału ufności, gdy poziom ufności wzrasta lub maleje?
Odpowiedź: Gdy poziom ufności wzrasta, przedział się poszerza. Gdy maleje – przedział się zawęża. Przedziały 0.90, 0.95, 0.99 są najczęściej używane.
Pytanie 14: Podaj przykład zestawu danych, dla którego wariancja wynosi 0.
Odpowiedź: Przykład: 10, 10, 10 – wszystkie wartości są równe, więc brak rozrzutu i wariancja = 0.
Pytanie 15: Co to jest wartość oczekiwana?
Odpowiedź: Wartość oczekiwana to średni wynik w długiej serii powtórzeń danego doświadczenia losowego.
Pytanie 16: Jak wpływają parametry mi i sigma na rozkład normalny?
Odpowiedź: Mi (średnia) przesuwa wykres w lewo/prawo. Sigma (odchylenie standardowe) wpływa na szerokość krzywej – im większa, tym bardziej płaska i szeroka krzywa; im mniejsza, tym wyższa i węższa.
Pytanie 17: Co to jest reguła trzech sigm?
Odpowiedź: To zasada statystyki mówiąca, że 99.7% danych w rozkładzie normalnym znajduje się w zakresie ±3σ od średniej. Umożliwia identyfikację wartości odstających.
Pytanie 18: Jak duża musi być próba, aby wariancja średnich próbkowych była 2x mniejsza?
Odpowiedź: Musi być 2 razy większa – wariancja średnich maleje proporcjonalnie do 1/n.
Pytanie 19: Jak duża musi być próba, aby odchylenie standardowe było 2x mniejsze?
Odpowiedź: Musi być 4 razy większa – bo odchylenie maleje proporcjonalnie do 1/√n.
Pytanie 20: Co mówi centralne twierdzenie graniczne o rozkładzie średnich próbkowych?
Odpowiedź: Średnie próbkowe mają rozkład normalny, nawet jeśli dane nie mają. Rozkład ten koncentruje się wokół średniej populacji, a jego rozrzut maleje wraz ze wzrostem liczebności próby.
Pytanie 21: Jak skrócić długość przedziału ufności przy tym samym poziomie ufności?
Odpowiedź: Zwiększyć liczebność próby – większa próba daje mniejszą niepewność.
Pytanie 22: Jak skrócić przedział ufności 2 razy?
Odpowiedź: Trzeba zwiększyć liczebność próby 4 razy – długość przedziału maleje z pierwiastkiem z n.
Pytanie 23: Co to jest histogram?
Odpowiedź: Histogram to graficzna reprezentacja rozkładu danych – pokazuje, ile obserwacji mieści się w określonych przedziałach wartości (tzw. binach). Oś X to przedziały, oś Y to liczność lub częstość.
Pytanie 24: Jak zmienia się długość przedziału ufności, gdy poziom ufności wzrasta lub maleje?
Odpowiedź: Gdy poziom ufności wzrasta, przedział się poszerza. Gdy maleje – przedział się zawęża. Przedziały 0.90, 0.95, 0.99 są najczęściej używane.
Pytanie 25: Podaj przykład zestawu danych, dla którego wariancja wynosi 0.
Odpowiedź: Przykład: 10, 10, 10 – wszystkie wartości są równe, więc brak rozrzutu i wariancja = 0.
Pytanie 26: Co to jest wartość oczekiwana?
Odpowiedź: Wartość oczekiwana to średni wynik w długiej serii powtórzeń danego doświadczenia losowego.
Pytanie 27: Jak wpływają parametry mi i sigma na rozkład normalny?
Odpowiedź: Mi (średnia) przesuwa wykres w lewo/prawo. Sigma (odchylenie standardowe) wpływa na szerokość krzywej – im większa, tym bardziej płaska i szeroka krzywa; im mniejsza, tym wyższa i węższa.
Pytanie 28: Co to jest reguła trzech sigm?
Odpowiedź: To zasada statystyki mówiąca, że 99.7% danych w rozkładzie normalnym znajduje się w zakresie ±3σ od średniej. Umożliwia identyfikację wartości odstających.
Pytanie 29: Jak duża musi być próba, aby wariancja średnich próbkowych była 2x mniejsza?
Odpowiedź: Musi być 2 razy większa – wariancja średnich maleje proporcjonalnie do 1/n.
Pytanie 30: Jak duża musi być próba, aby odchylenie standardowe było 2x mniejsze?
Odpowiedź: Musi być 4 razy większa – bo odchylenie maleje proporcjonalnie do 1/√n.
Pytanie 31: Co mówi centralne twierdzenie graniczne o rozkładzie średnich próbkowych?
Odpowiedź: Średnie próbkowe mają rozkład normalny, nawet jeśli dane nie mają. Rozkład ten koncentruje się wokół średniej populacji, a jego rozrzut maleje wraz ze wzrostem liczebności próby.
Pytanie 32: Jak skrócić długość przedziału ufności przy tym samym poziomie ufności?
Odpowiedź: Zwiększyć liczebność próby – większa próba daje mniejszą niepewność.
Pytanie 33: Jak skrócić przedział ufności 2 razy?
Odpowiedź: Trzeba zwiększyć liczebność próby 4 razy – długość przedziału maleje z pierwiastkiem z n.
Pytanie 34: Co to jest dystrybucja?
Odpowiedź: Jest to sposób rozkładu prawdopodobieństwa dla zmiennej losowej F_x(x) = P(X≤x)