[1] 20
Μάθημα 2: Εισαγωγικά για την R
2026-03-04
Το RStudio είναι το κυρίαρχο IDE (Integrated Development Environment) για την R (αντίστοιχο του Jupyter ή του VS Code).
Source (Πάνω Αριστερά) Εδώ γράφετε και αποθηκεύετε τα scripts σας (όπως ένα αρχείο .py).
Environment (Πάνω Δεξιά) Δείχνει τις ενεργές μεταβλητές (objects) και τα datasets που βρίσκονται στη μνήμη RAM.
Console (Κάτω Αριστερά) Εδώ η R εκτελεί τις εντολές και τυπώνει τα αποτελέσματα (σαν το Python terminal).
Files/Plots/Help (Κάτω Δεξιά) Διαχείριση αρχείων, εμφάνιση γραφημάτων και πρόσβαση στο Help.
<-)Στην Python χρησιμοποιούμε το =.
Στην R, το τυπικό σύμβολο εκχώρησης είναι το αριστερό βελάκι <-.
Η R κατανοεί δυναμικά τους τύπους δεδομένων (numeric, character, logical).
Ένα διάνυσμα (vector) είναι μια μονοδιάστατη δομή δεδομένων που περιέχει στοιχεία του ίδιου τύπου.
Δημιουργούνται με τη συνάρτηση c() (από το combine ή concatenate).
Προσοχή: Η R ξεκινάει την αρίθμηση (indexing) από το 1!
Στην Python, το πρώτο στοιχείο μιας λίστας βρίσκεται στη θέση 0.
Στην R, βρίσκεται στη θέση 1.
Αυτή είναι η πιο συνηθισμένη πηγή σφαλμάτων όταν μεταβαίνετε από την Python στην R.
[1] 0.3912114 0.9213983 -1.2659750 -0.6281914 0.1543779 0.4487731
[7] 0.7813155 -1.3644493 -0.9371209 0.8552818
Μπορούμε να διαλέξουμε τις πρώτες 3 τιμές της μεταβλητής values:
Μπορούμε να διαλέξουμε την 3η τιμές και την 5η τιμή της μεταβλητής values:
Άσκηση
Να διαλέξετε τις πρώτες 3 και την 5η τιμή της μεταβλητής
values.
Άσκηση
Να διαλέξετε τις θετικές τιμές της μεταβλητής
values.
None ή np.nan.NA (Not Available).Αν κάνετε πράξεις με NA, το αποτέλεσμα είναι NA.
Χρησιμοποιήστε την επιλογή na.rm = TRUE για να τα αγνοήσετε.
data frame είναι ένας δισδιάστατος πίνακας.Pandas της R.import βιβλιοθήκης.data frame είναι στην ουσία ένα διάνυσμα (vector).Χρησιμοποιούμε το $ για να απομονώσουμε μια στήλη.
Η R έχει ενσωματωμένες τις περισσότερες στατιστικές συναρτήσεις (mean(), median(), sd(), var(), cor()).
Η συνάρτηση summary() παρέχει άμεσα περιγραφικά στατιστικά (min, max, τεταρτημόρια, μέσο) για ένα vector ή ένα ολόκληρο data frame.
Η λογική είναι ίδια με την Python, αλλά η σύνταξη διαφέρει:
() για τη συνθήκη.{} για το μπλοκ κώδικα.Το elif της Python γράφεται ως else if στην R.
Άσκηση
Αν γράψετε τον κώδικα που να τυπώνει το αντίστοιχο μήνυμα αν το
xείναι κάτω από 10. Να κάνει το ίδιο αν τοxείναι κάτω από 15. Αλλιώς να τυπώνει ότι τοxείναι μεγαλύτερο του 15.
Η σύνταξη χρησιμοποιεί το πρότυπο for (μεταβλητή in ακολουθία) { … }.
Άσκηση
Να δημιουργήσετε ένα διάνυσμα x με τιμές από 10 έως 20. Μετά να γράψετε μία επανάληψη όπου κάθε στοιχείο του x θα αυξάνεται κατά 1. Υπάρχει πιο σωστός τρόπος;
Τι κάνουμε αν δεν είναι εύκολο να υπολογίσουμε το πλήθος των στοιχείων της x;
Μπορούμε να χρησιμοποιήσουμε την εντολή seq_along()
Άρα, στην προηγούμενη άσκηση μία άλλη λύση θα ήταν:
def.function() και την εκχωρούμε σε ένα αντικείμενο (object).
Άσκηση
Γράψτε μία συνάρτηση που υπολογίζει τα z-score ενός δείγματος.
