Η ερώτηση μου δηλαδή είναι γιατί δεν συμπληρώνουμε την στήλη missing values σε αυτές τις περιπτώσεις.
Ευχαριστώ
Καλημέρα σας,
Στη στήλη missing values καταχωρούμε τον τρόπο με τον οποίο δηλώνονται οι ελλείπουσες τιμές. Δηλαδή, αν κάποιος δεν είχε δώσει στοιχεία για την ημερομηνία γέννησης, αυτή θα καταχωρούνταν κανονικά ως 9999 και στη στήλη missing values θα δηλωνόταν το 9999 ως ο αριθμός που αντικαθιστά το κενό στην απάντηση. Στην εργασία σας όλοι οι συμμετέχοντες έχουν δώσει απαντήσεις σε όλες τις ερωτήσεις (μεταβλητές), άρα δεν υπάρχουν ελλείπουσες τιμές για να δηλωθούν με κάποιο τρόπο.
Η ορθότητα στην καταχώρηση των δεδομένων ελέγχεται α) με τα min-max για κάθε μεταβλητή, και β) με διασταύρωση από τα στοιχεία που έχουμε π.χ., σε ένα ερωτηματολόγιο.
Αυτά πρέπει να διορθωθούν πριν την ανάλυση.
ΣΜ
Σε συνέχεια της παραπάνω απάντησης, θα ήθελα να ρωτήσω το εξής: Παρά το γεγονός ότι στη συγκεκριμένη εργασία γνωρίζουμε εκ των προτέρων ότι όλοι οι συμμετέχοντες έχουν δώσει απαντήσεις σε όλες τις ερωτήσεις, σωστότερο (και για λόγους ελέγχου) δε θεωρείται όταν δηλώνουμε τα στοιχεία των μεταβλητών να ορίσουμε ότι θα μπορούσαν να υπάρχουν κι ελλείπουσες τιμές? Θα έχει αυτό κάποια άλλη επίπτωση στην ανάλυση αργότερα και είναι προτιμότερο να μη γίνει?
Ευχαριστώ
Βεβαίως και όταν στήνουμε εξαρχής μια βάση δεδεομένων (χωρίς να έχουμε ακόμα συλλέξει τα στοιχεία) δηλώνουμε εξαρχής την κωδικοποίηση για τις ελλείπουσες τιμές ως εξής:
αν η μεταβλητή παίρνει τιμές από 0,00-1,00 τότε ως κωδικό για την ελλείπουσα τιμή χρησιμοποιούμε το 9,00
αν η μεταβλητή παίρνει τιμές από 1,00-10 τότε ως κωδικό για την ελλείπουσα τιμή χρησιμοποιούμε το 99
αν η μεταβλητή παίρνει τιμές από 10-100 τότε ως κωδικό για την ελλείπουσα τιμή χρησιμοποιούμε το 999
αν η μεταβλητή παίρνει τιμές από 100-1000 τότε ως κωδικό για την ελλείπουσα τιμή χρησιμοποιούμε το 9999 κοκ.
Στη συγκεκριμένη άσκηση έχετε ήδη τα δεδομένα στη διάθεσή σας. Συνεπώς, γνωρίζετε αν έχουν ελλείπουσες τιμές ή όχι. Η δήλωσή τους στο SPSS δεν είναι λάθος, αλλά και η μη δήλωσή τους στην προκειμένη περίπτωση ομοίως δεν είναι λάθος.
Καλησπέρα σχετικά με το θέμα της κωδικοποίησης για τις ελλείπουσες τιμές θα ήθελα να ρωτήσω το εξής:
Στο video tutorial όλες οι ελλείπουσες τιμές που παρουσιάζονται είναι τετραψήφιες (9999) και στο participant gender που ;έχει μόνο δύο επιλογές (0=female, 1=male) καθώς φυσικά και στα υπόλοιπα variables όπως στο years of school (με επιλογές από 2 – 16) , family status (με επιλογές από 0-3).
Οπότε θα ήθελα να ρωτήσω εάν τελικά μπορούμε να βάζουμε ένα τετραψήφιο αριθμό όπως ο 9999 (όπως και στο tutorial) σε όλες τις μεταβλητές με missing values και να μην χρειάζεται να παίζουν οι τιμές των missing values από 9 – 9999… ανάλογα με το εύρος της εκάστοτε μεταβλητής.
Σας ευχαριστώ,
Καλημέρα!
Ναι, φυσικά μπορείτε να καθορίσετε εξαρχής ένα 4ψήφιο ή και 5ψήφιο αριθμό (99999) για τα missing values. Αυτό που πρέπει να προσέχετε για να καθορίσετε την τιμή είναι τα δεδομένα να μην μπορούν να λάβουν αυτή την τιμή. Π.χ., ο βαθμός πτυχίου μπορεί να είναι από 05-10. Σε αυτή την περίπτωση το 9 περιλαμβάνεται μέσα στο εύρος τιμών που παίρνει αυτή η μεταβλητή. Άρα δεν μπορείτε να το χρησιμοποιήσετε ως κωδικοποίηση για τις ελλείπουσες τιμές.
ΣΜ