Ποσοτικές Μέθοδοι
1ο μάθημα
2025-10-09
Στόχοι & ροή μαθήματος
- Να θυμηθούμε βασικές έννοιες: πληθυσμός–δείγμα, τυχαίες μεταβλητές & τύποι, κατανομές συχνοτήτων, μέτρα θέσης & διασποράς, συσχέτιση.
- Να εξασκηθούμε με μικρές ασκήσεις (μέχρι 45′ συνολικά).
Πληθυσμός, Δείγμα, Μονάδα ανάλυσης
- Πληθυσμός: Το πλήρες σύνολο ατόμων/αντικειμένων που μας ενδιαφέρει (π.χ. όλοι οι φοιτητές του τμήματος).
- Δείγμα: Υποσύνολο του πληθυσμού που παρατηρούμε (π.χ. 60 τυχαία επιλεγμένοι φοιτητές).
- Μονάδα ανάλυσης: Το αντικείμενο για το οποίο καταγράφουμε δεδομένα (π.χ. ένας φοιτητής).
Πληθυσμός, Δείγμα, Μονάδα ανάλυσης
- Στόχος δειγματοληψίας: Να συμπεράνουμε για τον πληθυσμό βασιζόμενοι στο δείγμα.
- Κίνδυνοι: Σφάλμα δειγματοληψίας (τυχαία διακύμανση) vs μεροληψία (συστηματικό λάθος επιλογής).
ΑΣΚΗΣΗ
Για καθεμία από τις παρακάτω περιγραφές, πες αν είναι πληθυσμός ή δείγμα και ποια είναι η μονάδα ανάλυσης.
- Όλοι οι μαθητές νηπιαγωγείου στην πόλη σας.
- 35 γονείς που απάντησαν σε ερωτηματολόγιο σε μια γιορτή του σχολείου.
- 10 τυχαία επιλεγμένα τμήματα νηπιαγωγείου από 50 συνολικά.
Ενδεικτικές απαντήσεις
- Πληθυσμός (μονάδα: μαθητής).
- Δείγμα (μονάδα: γονέας).
- Δείγμα (μονάδα: τμήμα/τάξη).
Τυχαίες μεταβλητές (ΤΜ)
- Ορισμός: Μεταβλητή που παίρνει τιμές ως αποτέλεσμα ενός τυχαίου φαινομένου.
- Ποιοτικές (κατηγορικές): εκφράζουν κατηγορίες.
- Ονομαστική: χωρίς φυσική τάξη (π.χ. χρώμα μαρκαδόρου).
- Διατάξιμη (Ordinal): έχει τάξη (π.χ. χαμηλή–μέτρια–υψηλή συμμετοχή).
Τυχαίες μεταβλητές (ΤΜ)
- Ποσοτικές (αριθμητικές): εκφράζουν ποσότητες.
- Διακριτές: μετρήσιμες με ακέραιες τιμές (π.χ. # παιδιών ανά ομάδα).
- Συνεχείς: μπορούν να πάρουν οποιαδήποτε τιμή σε διάστημα (π.χ. ύψος σε cm).
Κλίμακες μέτρησης — Γρήγορη υπενθύμιση
- Ονομαστική: Κατηγορίες χωρίς τάξη — επιτρέπονται συχνότητες/ποσοστά.
- Διατάξιμη: Κατηγορίες με τάξη — επιτρέπεται διάμεσος/τεταρτημόρια.
Κλίμακες μέτρησης — Γρήγορη υπενθύμιση
- Ισοδιαστημική: Αριθμητική κλίμακα με ίσα διαστήματα, χωρίς απόλυτο μηδέν (π.χ. °C).
- Αναλογική: Αριθμητική κλίμακα με φυσικό μηδέν (π.χ. βάρος, ύψος) — επιτρέπεται λόγος τιμών.
ΑΣΚΗΣΗ
Κατάταξε κάθε μεταβλητή: ονομαστική, διατάξιμη, διακριτή, συνεχής.
- Χρώμα πλαστελίνης που προτιμούν τα παιδιά.
- Βαθμός συμμετοχής (χαμηλή/μέτρια/υψηλή).
- Αριθμός αυτοκόλλητων που κέρδισε κάθε παιδί.
- Χρόνος (σε λεπτά) ελεύθερου παιχνιδιού.
Ενδεικτικές απαντήσεις
Ονομαστική, Διατάξιμη, Διακριτή, Συνεχής.
Κατανομές συχνοτήτων
- Πίνακας συχνοτήτων: καταμέτρηση ανά τιμή/κατηγορία.
- Σχετική συχνότητα: \( f_i / n \). Ποσοστό: \( 100 \times f_i / n \)%.
- Αθροιστική (για διατάξιμες/ποσοτικές): μέχρι και την τιμή/κλάση.
- Οπτικοποίηση: ραβδογράμματα (κατηγορικές), ιστογράμματα (ποσοτικές).
Κατανομές συχνοτήτων
Μικρό παράδειγμα (αριθμός αυτοκόλλητων, 12 παιδιά):
Τιμές: 0, 1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 6.
| 0 |
1 |
0.083 |
1 |
| 1 |
2 |
0.167 |
3 |
| 2 |
3 |
0.250 |
6 |
| 3 |
2 |
0.167 |
8 |
| 4 |
2 |
0.167 |
10 |
| 5 |
1 |
0.083 |
11 |
| 6 |
1 |
0.083 |
12 |
ΑΣΚΗΣΗ
Δεδομένα (ύψη σε cm, 20 παιδιά):
98, 101, 99, 105, 100, 102, 101, 104, 99, 103, 107, 98, 101, 100, 106, 104, 102, 103, 105, 101
- Φτιάξτε πίνακα συχνότητας και σχετικής συχνότητας.
- Ομαδοποιήστε σε κλάσεις [98–100], [101–103], [104–106], [107–109] και ξαναφτιάξτε τον πίνακα.
Ενδεικτική λύση (συνοπτικά)
- Συχνότητες τιμών: 98(2), 99(2), 100(2), 101(4), 102(2), 103(2), 104(2), 105(2), 106(1), 107(1). \(n=20\).
- Κλάσεις: [98–100]=6, [101–103]=8, [104–106]=5, [107–109]=1. Σχετικές: 0.30, 0.40, 0.25, 0.05.
Μέτρα θέσης (κεντρικής τάσης)
- Μέση τιμή: \( \bar{x} = \tfrac{1}{n}\sum x_i \). Ευαίσθητη σε ακραίες τιμές.
- Διάμεσος: μεσαία τιμή (ή μέσος των δύο μεσαίων). Ανθεκτική σε ακραίες τιμές.
- Επικρατούσα τιμή (modus): η πιο συχνή τιμή/κατηγορία.
- Ποσοστημόρια/Τεταρτημόρια: θέση δεδομένων σε % (π.χ. \(Q_1, \text{Med}, Q_3\)).
Συμβουλή: Για διατάξιμες μεταβλητές προτίμησε διάμεσο και τεταρτημόρια.
ΑΣΚΗΣΗ
Δεδομένα (λεπτά εξωτερικού παιχνιδιού σε μια εβδομάδα για 9 παιδιά):
20, 25, 30, 15, 40, 35, 25, 30, 45
Υπολογίστε: μέση τιμή, διάμεσο, modus και Q1–Q3.
Στρογγυλοποιήστε σε 1 δεκαδικό.
Ενδεικτική λύση
Ταξινόμηση: 15, 20, 25, 25, 30, 30, 35, 40, 45.
\(\bar{x} = 29.4\) · Διάμεσος = 30 · Modus = 25 και 30 (δι-τροπική).
\(Q_1 \approx 22.5\), \(Q_3 \approx 37.5\).
Μέτρα διασποράς
- Εύρος: \( \max - \min \).
- Ενδοτεταρτημοριακό εύρος (IQR): \( Q_3 - Q_1 \) — ανθεκτικό σε outliers.
- Διακύμανση (δείγμα): \( s^2 = \tfrac{1}{n-1}\sum (x_i-\bar{x})^2 \).
- Τυπική απόκλιση: \( s = \sqrt{s^2} \).
Ερμηνεία: Μεγαλύτερη διασπορά ⇒ μεγαλύτερη μεταβλητότητα γύρω από το κέντρο.
ΑΣΚΗΣΗ
Δύο τμήματα κατέγραψαν λεπτά ανάγνωσης στο σπίτι (10 μαθητές το καθένα).
- Τμήμα Α: 15, 20, 25, 25, 30, 30, 35, 35, 40, 45
- Τμήμα Β: 10, 10, 25, 25, 30, 30, 35, 35, 50, 50
- Υπολογίστε για κάθε τμήμα: εύρος, IQR, s.
- Ποιο τμήμα έχει μεγαλύτερη μεταβλητότητα; Τεκμηριώστε.
Ενδεικτική λύση (σκέψη)
Ίδιες κεντρικές τάσεις περίπου, αλλά το Β έχει πιο ακραίες τιμές (10 & 50) ⇒ μεγαλύτερο εύρος και τυπική απόκλιση. Το IQR είναι παρόμοιο, δείχνοντας παρόμοια «μεσαία διασπορά».
Συσχέτιση
- Συσχέτιση: Βαθμός γραμμικής σχέσης ανάμεσα σε δύο ποσοτικές μεταβλητές.
\[ r = \frac{\sum (x_i-\bar x)(y_i-\bar y)}{\sqrt{\sum (x_i-\bar x)^2\,\sum (y_i-\bar y)^2}} \]
Συσχέτιση
- Συντελεστής συσχέτισης Pearson (r): τιμές από −1 έως +1.
- r > 0: θετική σχέση (όσο αυξάνει η μία, αυξάνει και η άλλη).
- r < 0: αρνητική σχέση (όσο αυξάνει η μία, μειώνεται η άλλη).
- r ≈ 0: καμία/ασθενής γραμμική σχέση.
- Ισχύς (χονδρικά): 0.0–0.3 ασθενής, 0.3–0.6 μέτρια, 0.6–1.0 ισχυρή.
Συσχέτιση
- Θετική ισχυρή: ύψος και βάρος σε παιδιά ίδιας ηλικίας (συνήθως).
- Αρνητική μέτρια: ώρα ύπνου και υπνηλία την επόμενη μέρα.
- Μη γραμμική: χρόνος παιχνιδιού vs ευερεθιστότητα (πιθανό U-σχήμα).
- Μηδενική/ασθενής: χρώμα τσάντας και επίδοση.
Συσχέτιση
Προσοχή
Συσχέτιση \(\neq\) αιτιότητα. Πιθανά συγχυτικά, ακραίες τιμές, μη γραμμικές σχέσεις, περιορισμένο εύρος τιμών.
Όχι Pearson r
- Υπάρχουν ακραίες τιμές ή μη γραμμικότητα.
- Μεταβλητές είναι διατάξιμες (όχι πραγματικά συνεχείς).
ΑΣΚΗΣΗ
Μέρος Α. Για κάθε σενάριο, ορίστε πρόσημο και ισχύ της συσχέτισης (ασθενής/μέτρια/ισχυρή). 1. Ώρες μελέτης και βαθμός σύντομου τεστ.
2. Απόσταση από το σχολείο και χρόνος άφιξης στην τάξη.
3. Ύψος και μέγεθος παπουτσιού.
4. Ηλικία νηπίων (4–6) και αριθμός λαθών σε απλή άσκηση λεπτής κινητικότητας.
ΑΣΚΗΣΗ
Μέρος Β (7′). Μικρά δεδομένα (6 ζεύγη):
\(x\): 1, 2, 3, 4, 5, 6
\(y\): 2, 2, 4, 5, 6, 7
- Σχηματίστε πρόχειρο γράφημα διασποράς (στο χαρτί).
- Εκτιμήστε προφορικά το r (ασθενές/μέτριο/ισχυρό; πρόσημο;).
- (Προαιρετικά) Υπολογίστε το r με τα βήματα: αφαιρέστε μέσους, υπολογίστε γινόμενα αποκλίσεων, κανονικοποιήστε με τυπικές αποκλίσεις.
ΑΣΚΗΣΗ
Ενδεικτικές απαντήσεις
Μέρος Α: (1) θετική μέτρια–ισχυρή, (2) θετική μέτρια, (3) θετική μέτρια–ισχυρή, (4) πιθανώς αρνητική ασθενής (ανάλογα με το εύρος ηλικιών).
Μέρος Β: ισχυρή θετική συσχέτιση, \(r\) ≈ 0.98.
Υπενθύμιση τύπων (για γρήγορη αναφορά)
- \( \bar{x} = \tfrac{1}{n}\sum x_i \), \( \tilde{x} = \text{median} \).
- \( s^2 = \tfrac{1}{n-1}\sum (x_i-\bar{x})^2 \), \( s = \sqrt{s^2} \).
- Σχετική συχνότητα: \( f_i/n \), Ποσοστό: \(100 f_i/n\)%.
- \( IQR = Q_3 - Q_1 \).
- Pearson r: βλέπε τύπο στη σχετική διαφάνεια.
Συχνά λάθη & μικρές συμβουλές
- Μην αναμειγνύετε μέτρα με ακατάλληλους τύπους μεταβλητών (π.χ. μέσος όρος σε ονομαστική).
- Ελέγξτε μονάδες μέτρησης & στρογγυλοποίηση (π.χ. 1 δεκαδικό).
- Για στρεβλές κατανομές: προτιμήστε διάμεσο & IQR.
- Συσχέτιση ≠ αιτιότητα — να αναζητάτε πιθανά συγχυτικά.
- Προβληματιστείτε για ακραίες τιμές
Μικρή ανακεφαλαίωση
- Ορισμοί: πληθυσμός–δείγμα–μονάδα.
- ΤΜ & κλίμακες μέτρησης.
- Πίνακες/κλάσεις συχνοτήτων.
- Μέτρα θέσης (\(\bar{x}, \tilde{x}, \text{modus}\)) & διασποράς (εύρος, IQR, \(s\)).
- Συσχέτιση.