Επανάληψη

Αλέξανδρος Ρέκκας

2025-12-18

Ερώτηση 1

Σενάριο: Προβλέπουμε την “Ετοιμότητα για το Σχολείο” (0=Όχι, 1=Ναι). Το μοντέλο έδωσε: \[log(\frac{p}{1-p}) = -2.50 + 0.40 \cdot (Social\_Skills) + 1.10 \cdot (Attendance)\] (Όπου Attendance: 1 για High, 0 για Low)

Ερώτηση: Ποια είναι η πιθανότητα (P) ετοιμότητας για ένα παιδί με Social Skills = 8 και High Attendance;

  • α) 0.651
  • β) 0.862
  • γ) 0.858
  • δ) 0.142

Η σωστή απάντηση είναι το (γ)

Υπολογισμός:

\(Logit = -2.50 + (0.40 \cdot 8) + (1.10 \cdot 1) = -2.50 + 3.2 + 1.1 = 1.8\)
\(P = \frac{e^{1.8}}{1 + e^{1.8}} = \frac{6.05}{7.05} \approx 0.858\)

Ερώτηση 2

Comparison Predictor Estimate SE p Odds Ratio
Ζωγραφική vs Τουβλάκια
Intercept -1.20 0.50 .016 0.30
Gender (Κορίτσι - Αγόρι) 1.10 0.30 <.001 3.00
Fine_Motor 0.40 0.10 <.001 1.49
Activity_Level -0.10 0.10 .317 0.90
Ανάγνωση vs Τουβλάκια
Intercept 0.50 0.60 .405 1.64
Gender (Κορίτσι - Αγόρι) 0.40 0.35 .253 1.49
Fine_Motor 0.05 0.12 .670 1.05
Activity_Level -0.80 0.15 <.001 0.45

Ερώτηση 2

Ποιες είναι οι πιθανότητες ένας νέος μαθητής να παίξει με τουβλάκια, να κάνει ζωγραφική, να διαβάσει βιβλίο όταν έχει:

  • Φύλο: Αγόρι
  • Λεπτή κινητικότητα: 3
  • Δραστηριότητα: 9

Τι θα επιλέξει μάλλον το παιδί;

Ερώτηση 3

Σενάριο: Ικανοποίηση (1=Δυσαρεστημένος, 2=Ουδέτερος, 3=Ικανοποιημένος) ως συνάρτηση της υποστήριξης:

Predictor Estimate
Support 0.6

Τα κατώφλια είναι

Threshold Estimate
Δυσαρεστημένος -2.5
Ουδέτερος 3

Ερώτηση 3

Ερώτηση: Ποιες είναι οι πιθανότητες \(P(Y=1)\), \(P(Y=2)\) και \(P(Y=3)\) για το συγκεκριμένο παιδί;

  • α) \(P_1=0.100,\ P_2=0.400,\ P_3=0.500\)
  • β) \(P_1=0.083,\ P_2=0.917,\ P_3=0.000\)
  • γ) \(P_1 \approx 0.0004,\ P_2 \approx 0.0828,\ P_3 \approx 0.9168\)
  • δ) \(P_1 \approx 0.0004,\ P_2 \approx 0.0832,\ P_3 \approx 0.9164\)

Η σωστή απάντηση είναι το (γ)

Βήματα Υπολογισμού:

  1. Υπολογισμός Logits (\(P \le j\)):
    • \(Logit(P \le 1) = -2.50 - (0.60 \cdot 9) = -7.9\)
    • \(Logit(P \le 2) = 3.00 - (0.60 \cdot 9) = -2.4\)
  2. Μετατροπή σε Αθροιστικές Πιθανότητες:
    • \(P(Y \le 1) = \frac{e^{-7.9}}{1 + e^{-7.9}} \approx \mathbf{0.00037}\)
    • \(P(Y \le 2) = \frac{e^{-2.4}}{1 + e^{-2.4}} \approx \mathbf{0.08316}\)
  3. Υπολογισμός Πιθανότητας ανά Κατηγορία:
    • \(P(Y=1) = P(Y \le 1) = \mathbf{0.00037}\)
    • \(P(Y=2) = P(Y \le 2) - P(Y \le 1) = 0.08316 - 0.00037 = \mathbf{0.08279}\)
    • \(P(Y=3) = 1 - P(Y \le 2) = 1 - 0.08316 = \mathbf{0.91684}\)

Ερώτηση 4

Σενάριο: Μοντέλο πρόβλεψης “Κοινωνικής Ωριμότητας” (0-50 μονάδες). Εξίσωση: \(Score = 10.0 + 2.5 \cdot (Siblings) - 1.5 \cdot (Screen\_Time) + 3.0 \cdot (Engagement)\)

Predictor Estimate p-value
Siblings (Αριθμός αδερφών) 2.5 0.040
Screen_Time (Ώρες οθόνης) -1.5 0.001
Engagement (Εμπλοκή γονέα) 3.0 0.250

Ερώτηση 4

Ερώτηση: Αν ένα παιδί αποκτήσει 2 νέα αδέρφια, πώς αναμένεται να αλλάξει το σκορ του σύμφωνα με το μοντέλο, και είναι αυτό το εύρημα αξιόπιστο;

  • α) Θα αυξηθεί κατά 2.5 μονάδες και είναι στατιστικά σημαντικό.
  • β) Θα αυξηθεί κατά 5.0 μονάδες και είναι στατιστικά σημαντικό
  • γ) Θα αυξηθεί κατά 3.0 μονάδες αλλά δεν είναι σημαντικό.
  • δ) Θα μειωθεί κατά 5.0 μονάδες και είναι στατιστικά σημαντικό.

Η σωστή απάντηση είναι το (β)

Επεξήγηση: Ο συντελεστής 2.5 αφορά την ύπαρξη ενός αδερφού. Για 2 αδέρφια έχουμε \(2.5 \times 2 = 5.0\). Επειδή το \(p=0.040 < 0.05\), η επίδραση θεωρείται στατιστικά σημαντική.

Ερώτηση 5

Σε ένα μοντέλο πρόβλεψης της επίδοσης στα μαθηματικά με τη χρήση γραμμικής παλινδρόμησης, το \(R^2\) βρέθηκε ίσο με 0.40. Τι σημαίνει αυτό;

  • α) Το 40% των μαθητών απάντησε σωστά στις ερωτήσεις.
  • β) Η πρόβλεψη του μοντέλου είναι λάθος στο 40% των περιπτώσεων.
  • γ) Το 40% της διακύμανσης (διαφορών) στην επίδοση των μαθητών εξηγείται από τις μεταβλητές του μοντέλου.
  • δ) Υπάρχει 40% πιθανότητα η ηλικία να επηρεάζει τα μαθηματικά.

Η σωστή απάντηση είναι το (γ)

Θυμηθείτε: Το \(R^2\) (συντελεστής προσδιορισμού) δείχνει το ποσοστό της μεταβλητότητας της εξαρτημένης μεταβλητής που “ερμηνεύεται” από τους παράγοντες που συμπεριλήφθηκαν στο μοντέλο. Το υπόλοιπο 60% οφείλεται σε παράγοντες που δεν μετρήσαμε.

Ερώτηση 6

Σενάριο: Μοντέλο πρόβλεψης “Επιτυχίας σε Τεστ Γλωσσικής Επάρκειας”.

\[log(\frac{p}{1-p})= -4.0 + 0.5 \cdot (Score)\]

Ερώτηση: Ποια είναι η πιθανότητα επιτυχίας (P) για ένα παιδί που έγραψε Score = 8;

  • α) 0.00
  • β) 0.50
  • γ) 1.00
  • δ) 0.80

Η σωστή απάντηση είναι το (β)

Βήματα Υπολογισμού:

\(Logit = -4.0 + (0.5 \cdot 8) = -4.0 + 4.0 = \mathbf{0}\)
\(P = \frac{e^{0}}{1 + e^{0}} = \frac{1}{1 + 1} = \mathbf{0.50}\)
Θυμηθείτε: Όταν το Logit είναι 0, η πιθανότητα είναι πάντα 50%.

Ερώτηση 7

Σενάριο: Σε ένα μοντέλο λογιστικής παλινδρόμησης για την πρόβλεψη της “Σχολικής Ετοιμότητας”, ο πίνακας αποτελεσμάτων δείχνει ότι η μεταβλητή “Υψηλή Συμμετοχή” έχει Odds Ratio (OR) = 3.00.

Ερώτηση: Ποια είναι η τιμή του συντελεστή Estimate (\(\beta\)) για τη συγκεκριμένη μεταβλητή στον πίνακα των αποτελεσμάτων;

  • α) 3.00
  • β) 0.33
  • γ) 1.10
  • δ) -1.10

Η σωστή απάντηση είναι το (γ)

Βήματα Υπολογισμού:

Η σχέση μεταξύ Odds Ratio και συντελεστή \(\beta\) είναι: \(OR = e^{\beta}\)
Για να βρούμε το \(\beta\), εφαρμόζουμε τον φυσικό λογάριθμο: \(\beta = \ln(OR)\)
\(\beta = \ln(3.00) \approx \mathbf{1.0986}\) (στρογγυλοποίηση σε 1.10).

Ερώτηση 8

Σενάριο: Προβλέπουμε την “Επιτυχία” (0=Όχι, 1=Ναι). Μεταβλητή: Τύπος Σχολείου (Επίπεδο Αναφοράς: Δημόσιο). Το μοντέλο έδωσε για το Ιδιωτικό Σχολείο: Estimate (\(\beta\)) = 1.39.

Ερώτηση: Αν αλλάζαμε την ομάδα αναφοράς και θέταμε ως βάση το Ιδιωτικό Σχολείο, ποιο θα ήταν το νέο odds ratio για το Δημόσιο Σχολείο;

  • α) \(e^{1.39}=4\)
  • β) \(e^{-1.39}=0.25\)
  • γ) -1.39
  • δ) 4.00

Η σωστή απάντηση είναι το (β)

Η Μαθηματική Λογική:

  1. Όταν αλλάζουμε την ομάδα αναφοράς σε μία δυαδική μεταβλητή, το Odds Ratio αντιστρέφεται (\(1/OR\)).
  2. Το odds ratio τώρα είναι \(\exp{1.39} = 4\)
  3. Όταν αλλάξει το επίπεδο αναφοράς OR=1/4=0.25

Ερώτηση 9

Έχετε ένα μοντέλο που εξηγεί την επίδοση στα μαθηματικά με βάση την ηλικία. Αν προσθέσετε στο μοντέλο τη μεταβλητή “Νούμερο παπουτσιού”, τι θα συμβεί στους δείκτες \(R^2\) και \(Adjusted R^2\);

  • α) Θα αυξηθούν και οι δύο, γιατί έχουμε περισσότερη πληροφορία.
  • β) Θα μειωθούν και οι δύο, γιατί η μεταβλητή είναι άσχετη.
  • γ) Το \(R^2\) θα παραμείνει ίδιο ή θα αυξηθεί ελαφρώς, ενώ το \(Adjusted R^2\) θα μειωθεί.
  • δ) Το \(Adjusted R^2\) θα παραμείνει ίδιο ή θα αυξηθεί ελαφρώς, ενώ το \(R^2\) θα μειωθεί.

Η σωστή απάντηση είναι το (γ)

Το \(R^2\) ανεβαίνει πάντα μαθηματικά όταν προσθέτουμε μεταβλητές, ακόμα κι αν είναι εντελώς άσχετες. Το Adjusted \(R^2\) όμως “τιμωρεί” το μοντέλο για κάθε περιττή μεταβλητή που δεν έχει πραγματική ερμηνευτική ισχύ.

Ερώτηση 10

Σενάριο: $\(log(\frac{p}{1-p}) = \beta_0 + \beta_1 \cdot X\). Έστω ότι για ένα παιδί, ο υπολογισμός της εξίσωσης δίνει ακριβώς 0.

Ερώτηση: Τι σημαίνει αυτό για την πιθανότητα (P) ετοιμότητας του παιδιού;

  • α) Η πιθανότητα είναι 0%.
  • β) Οι συμπληρωματικές πιθανότητες (odds) είναι 0.
  • γ) Η πιθανότητα είναι 50%.
  • δ) Η πιθανότητα είναι 100%

Η σωστή απάντηση είναι το (γ)

Για τα odds ισχύει \(odds = e^0 = 1\).
Άρα \(odds = \frac{p}{1-p}=1\)
Η πιθανότητα είναι \(p = \frac{1}{1 + 1} = 0.50\).