Απλή γραμμική παλινδρόμηση
2ο μάθημα
2025-10-16
Περιεχόμενα
- Ορισμός συντελεστή συσχέτισης \(r\)
- Εισαγωγή στα αθροίσματα τετραγώνων και γινομένων
- Μοντέλο απλής γραμμικής παλινδρόμησης
- Πρόβλεψη με την ευθεία
- Σφάλμα πρόβλεψης (υπόλοιπα)
- Έλεγχος υποθέσεων (μόνο απλή παλινδρόμηση)
Συσχέτιση (ορισμός)
\[ r = \frac{\sum (x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum (x_i-\bar x)^2\,\sum (y_i-\bar y)^2}} \]
Άθροισμα γινομένων
- \(S_{xy} = \sum (x_i - \mu_x)(y_i-\mu_y)\)
- \(S_{xx} = \sum (x_i - \mu_x)^2\)
- \(S_{yy}= \sum (y_i - \mu_y)^2\)
Συσχέτιση
\[
r = \frac{S_{xy}}{\sqrt{S_{xx}S_{yy}}}
\]
Απλή Γραμμική Παλινδρόμηση: ιδέα
- Στόχος: εύρεση ευθείας που ελαχιστοποιεί τα τετράγωνα των σφαλμάτων
- Μοντέλο: \(\hat{y} = \beta_0 + \beta_1 x\)
- Προβλέπουμε τη αναμενόμενη τιμή του \(Y\) για δοσμένο \(X\)
Η ευθεία παλινδρόμησης
- \(\hat{y}_i = \beta_0 + \beta_1 x_i\)
- \(\beta_1\): κλίση (μεταβολή στο \(Y\) ανά 1 μονάδα \(X\))
- \(\beta_0\): τομή με τον άξονα \(Y\) (αναμενόμενη τιμή του \(Y\) όταν \(x=0\))
- Η ευθεία περνά από \((\bar{x}, \bar{y})\)
Υπολογισμός κλίσης \(\beta_1\)
- \(\beta_1 = \frac{S_{xy}}{S_{xx}}\)
- \(\beta_0 = \bar{y} - \beta_1 \bar{x}\)
Παράδειγμα
| 5 |
10 |
| 1 |
4 |
| 4 |
5 |
| 7 |
11 |
| 6 |
15 |
| 4 |
6 |
| 3 |
5 |
| 2 |
0 |
Ερμηνεία \(\beta_1\) και \(\beta_0\)
- \(\beta_1\): μέση αλλαγή στο \(Y\) ανά 1 μονάδα \(X\)
- \(\beta_0\): σημείο αναφοράς
Πρόβλεψη με τη γραμμή
- Για \(x_0\): \(\hat{y}(x_0) = \beta_0 + \beta_1 x_0\)
- Εσωπαρεμβολή (εντός εύρους \(X\)): ασφαλέστερη
- Προβολή (εκτός εύρους): ριψοκίνδυνη και ανεπιβεβαίωτη
Τυπικό σφάλμα εκτίμησης (s_e)
- \(s_e = \sqrt{\frac{S_{υπόλοιπο}}{n-2}}\) (\(\text{df}= n-2\))
- \(r^2\) μας δίνει το ποσοστό της διακύμανσης της \(Y\) που εξηγείται από τη \(X\)
- \(SS_{παλινδρόμηση} = r^2 S_{yy}\)
- \(SS_{υπόλοιπο} = (1 - r^2) S_{yy}\)
Έλεγχος υπόθεσης
- \(H_0: \beta_1 = 0\) (καμία γραμμική σχέση)
- \(MS_{παλινδρομηση} = \frac{SS_{παλινδρομηση}}{df}\) (\(\text{df} = 1\))
- \(MS_{υπολοιπο} = \frac{SS_{υπολοιπο}}{df}\) (\(\text{df} = n - 2\))
- \(F = \frac{MS_{παλινδρομηση}}{MS_{υπολοιπο}}\) με \(\text{df} = 1, n-2\)