Λογιστική παλινδρόμηση

Αλέξανδρος Ρέκκας

2025-11-20

Ανακεφαλαίωση

Το μοντέλο

Το μοντέλο της λογιστικής παλινδρόμησης έχει τη μορφή: \[ P(Y=1) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1+\beta_2X_2+\dots+\beta_kX_k)}} \]

Ένας άλλος τρόπος γραφής του μοντέλου είναι: \[ \log\Big(\frac{P(Y = 1)}{1 - P(Y = 1)}\Big) = \beta_0 + \beta_1X_1+\beta_2X_2+\dots+\beta_kX_k \]

Απόκλιση

Για να αξιολογήσουμε ένα μοντέλο λογιστικής παλινδρόμησης χρησιμοποιούμε την απόκλιση (deviance):

\[ \text{Deviance} = -2\times\text{log-likelihood} \]

Την ποσότητα αυτή τη συμβολίζουμε με -2LL.

Δοκιμασία λόγου πιθανοφανειών

Για να αξιολογήσουμε αν είχε νόημα το μοντέλο που χρησιμοποιήσαμε χρησιμοποιούμε τον έλεγχο \(X^2\) .

Υπολογίζουμε το στατιστικό \[ \begin{aligned} \chi^2 &= (-2LL(\text{basic})) - (-2LL(\text{full})) \\ &= \operatorname{deviance}(\text{basic}) - \operatorname{deviance}(\text{full}) \end{aligned} \]

Οι βαθμοί ελευθερίας του ελέγχου είναι:

\[ \text{df} = k_{full} - k_{basic} \]

\(R^2\) στη λογιστική παλινδρόμηση

Δεν υπάρχει ακριβώς αντίστοιχο μέτρο με το \(R^2\) της γραμμικής παλινδρόμησης.

\[ R^2_{HL} = \frac{(\operatorname{-2LL}(\text{baseline})) - (\operatorname{-2LL}(\text{full}))}{\operatorname{-2LL}(\text{baseline})} \]

Συμπληρωματικές παρατηρήσεις

Ερμηνεία συντελεστών \(\beta\)

Έστω ότι έχουμε μία μεταβλητή \(X\) για το φύλο ενός παιδιού:

\[ X = \begin{cases} 1 & \textrm{αν το παιδί είναι κορίτσι} \\ 0 & \textrm{αν το παιδί είναι αγόρι} \end{cases} \]

Έστω ότι έχουμε μία μεταβλητή \(Y\) για το αν ένα παιδί έπαιξε με άλλα παιδιά σε μια δραστηριότητα:

\[ Y = \begin{cases} 1 & \text{αν το παιδί έπαιξε με άλλα παιδιά} \\ 0 & \text{αν το παιδί δεν έπαιξε με άλλα παιδιά} \end{cases} \]

Ερμηνεία συντελεστών \(\beta\)

Εκτιμούμε το μοντέλο

\[ \log\Big(\frac{P(Y = 1)}{1 - P(Y = 1)}\Big) = 1 + 2X_1 \]

Τι μας λέει το \(\beta_1 = 2\);

Ερμηνεία συντελεστών \(\beta\)

Για τα αγόρια:

\[ \log\Big(\frac{P(Y = 1| X = \textrm{αγόρι})}{1 - P(Y = 1|X = \textrm{αγόρι})}\Big) = 1 \]

Για τα κορίτσια:

\[ \log\Big(\frac{P(Y = 1) | X = \text{κορίτσι}}{1 - P(Y = 1 | X = \text{κορίτσι})}\Big) = 1 + 2 = 3 \]

Ερμηνεία συντελεστών \(\beta\)

\[ e^{\beta_1} = e^2 = \frac{\frac{P(Y = 1 | X = \text{κορίτσι})}{1 - P(Y = 1 | X = \text{κορίτσι})}}{\frac{P(Y = 1 | X = \text{αγόρι})}{1 - P(Y = 1 | X = \text{αγόρι})}} \]

Υπολογισμός πιθανοτήτων

Ο τύπος της λογιστικής παλινδρόμησης είναι:

\[ \log\Big(\frac{P(Y=1)}{1 - P(Y = 1)}\Big) = \beta_0+\beta_1X_1+\dots+\beta_kX_k \]

Αν λύσουμε τον τύπο ως προς \(P(Y = 1)\):

\[ P(Y = 1) = \frac{1}{1 + e^{-(\beta_0+\beta_1X_1+\dots+\beta_kX_k)}} = \frac{e^{(\beta_0+\beta_1X_1+\dots+\beta_kX_k)}}{1 + e^{(\beta_0+\beta_1X_1+\dots+\beta_kX_k)}} \]

Πολυωνυμική παλινδρόμηση
(ordinal regression)

Παραπάνω από δύο κατηγορίες

Τι κάνουμε όταν η εξαρτημένη μεταβλητή έχει παραπάνω από δύο πιθανές τιμές (κατηγορίες);

Ορισμός

Στην πολυωνυμική παλινδρόμηση εφαρμόζουμε ξεχωριστές λογιστικές παλινδρομήσεις για κάθε κατηγορία.

Λογιστική παλινδρόμηση

Ανακεφαλαίωση

Το μοντέλο

Απόκλιση

Δοκιμασία λόγου πιθανοφανειών

\(R^2\) στη λογιστική παλινδρόμηση

Συμπληρωματικές παρατηρήσεις

Ερμηνεία συντελεστών \(\beta\)

Ερμηνεία συντελεστών \(\beta\)

Ερμηνεία συντελεστών \(\beta\)

Ερμηνεία συντελεστών \(\beta\)

Υπολογισμός πιθανοτήτων

Πολυωνυμική παλινδρόμηση (ordinal regression)

Παραπάνω από δύο κατηγορίες

Ορισμός

Πολυωνυμική παλινδρόμηση
(ordinal regression)