Διαφορά μεταξύ τυπικής απόκλισης και τυπικού σφάλματος Διαφορά μεταξύ

Anonim

Εισαγωγή

Τυποποιημένη D αποφυγή (SD) > E rror (SE) είναι φαινομενικά παρόμοιες ορολογίες. ωστόσο, είναι εννοιολογικά τόσο ποικίλες ώστε να χρησιμοποιούνται σχεδόν αδιακρίτως στη βιβλιογραφία των στατιστικών. Και οι δύο όροι προηγούνται συνήθως από ένα σύμβολο συν (+/-) που είναι ενδεικτικό του γεγονότος ότι ορίζουν μια συμμετρική τιμή ή αντιπροσωπεύουν ένα εύρος τιμών. Σε κάθε περίπτωση, και οι δύο όροι εμφανίζονται με ένα μέσο (μέσο) σύνολο μετρημένων τιμών. Είναι ενδιαφέρον ότι μια SE δεν έχει καμία σχέση με τα πρότυπα, με σφάλματα ή με την κοινοποίηση επιστημονικών δεδομένων. Μια λεπτομερής ματιά στην προέλευση και την εξήγηση των SD και SE θα αποκαλύψει, γιατί οι επαγγελματίες στατιστικολόγοι και εκείνοι που το χρησιμοποιούν με τη σειρά τους, και οι δύο τείνουν να κάνουν λάθος.

Τυπική Απόκλιση (SD)

Ένα SD είναι ένα περιγραφικό

στατιστικό στοιχείο που περιγράφει την εξάπλωση μιας διανομής. Ως μέτρηση, είναι χρήσιμο όταν τα δεδομένα διανέμονται κανονικά. Ωστόσο, είναι λιγότερο χρήσιμο όταν τα δεδομένα είναι εξαιρετικά λοξά ή διχρωματικά, επειδή δεν περιγράφουν πολύ καλά το σχήμα της διανομής. Συνήθως, χρησιμοποιούμε SD κατά την αναφορά των χαρακτηριστικών του δείγματος, επειδή σκοπεύουμε να

περιγράψουμε

πόσο τα δεδομένα ποικίλλουν γύρω από τον μέσο όρο. Άλλες χρήσιμες στατιστικές για την περιγραφή της εξάπλωσης των δεδομένων είναι η περιοχή μεταξύ τεταρτημορίων, το 25ο και το 75ο εκατοστημόριο και το εύρος των δεδομένων.

Σχήμα 1. Η SD είναι μέτρο της εξάπλωσης των δεδομένων. Όταν τα δεδομένα είναι ένα δείγμα από μια κανονικά κατανεμημένη κατανομή, τότε αναμένονται τα δύο τρίτα των δεδομένων να βρίσκονται εντός μιας τυπικής απόκλισης του μέσου όρου. Η διακύμανση είναι επίσης μια στατιστική περιγραφική

, και ορίζεται ως το τετράγωνο της τυπικής απόκλισης. Δεν αναφέρεται συνήθως κατά την περιγραφή των αποτελεσμάτων, αλλά είναι ένας μαθηματικώς ελκώμενος τύπος (α. Α. Α. Το άθροισμα των τετραγωνικών αποκλίσεων) και παίζει ένα ρόλο στον υπολογισμό των στατιστικών.

Εάν έχουμε δύο στατιστικά στοιχεία

P & Q

με γνωστές διαφορές

var (P) & < var (Q) , τότε η διακύμανση του ποσού P + Q είναι ίση με το άθροισμα των διαφορών: var > var (Q) . Είναι πλέον εμφανές γιατί οι στατιστικολόγοι θέλουν να μιλήσουν για διακυμάνσεις. Ωστόσο, οι τυπικές αποκλίσεις έχουν σημαντική σημασία για την εξάπλωση, ιδιαίτερα όταν τα δεδομένα διανέμονται κανονικά: Το μέσο διάστημα +/- 1 SD αναμένεται να καταγράψει τα 2/3 του δείγματος και το διάστημα η μέση τιμή + - 2 SD μπορεί να αναμένεται να συλλάβει το 95% του δείγματος. Το SD παρέχει μια ένδειξη για το βαθμό στον οποίο οι μεμονωμένες απαντήσεις σε μια ερώτηση ποικίλλουν ή "αποκλίνουν" από τον μέσο όρο.Η SD λέει στον ερευνητή πόσο απλωμένα είναι οι απαντήσεις - είναι συγκεντρωμένες γύρω από τον μέσο όρο ή είναι διάσπαρτα μακριά και ευρέως; Μήπως όλοι οι ερωτηθέντες σας βαθμολόγησαν το προϊόν σας στη μέση της κλίμακας σας, ή κάποιοι το ενέκριναν και κάποιοι το αποδοκιμάζουν; Εξετάστε ένα πείραμα όπου οι ερωτηθέντες καλούνται να βαθμολογήσουν ένα προϊόν σε μια σειρά χαρακτηριστικών σε κλίμακα 5 σημείων. Ο μέσος όρος για μια ομάδα δέκα ερωτηθέντων (με την ένδειξη «Α» έως «J» παρακάτω) για «καλή αξία για τα χρήματα» ήταν 3,2 με SD 0,4 και ο μέσος όρος για «αξιοπιστία προϊόντος» ήταν 3,4 με SD 2,1

Με την πρώτη ματιά (εξετάζοντας μόνο τα μέσα) φαίνεται ότι η αξιοπιστία βαθμολογήθηκε υψηλότερα από την τιμή. Όμως, το υψηλότερο SD για την αξιοπιστία θα μπορούσε να δείξει (όπως φαίνεται στην παρακάτω κατανομή) ότι οι απαντήσεις ήταν πολύ πολωμένες, όπου οι περισσότεροι ερωτηθέντες δεν είχαν ζητήματα αξιοπιστίας (βαθμολόγησαν το χαρακτηριστικό "5"), αλλά ένα μικρότερο αλλά σημαντικό τμήμα των ερωτηθέντων ένα πρόβλημα αξιοπιστίας και αξιολόγησε το χαρακτηριστικό "1". Κοιτάζοντας το μέσο μόνο λέει μόνο ένα μέρος της ιστορίας, ωστόσο, πιο συχνά από ό, τι είναι, αυτό είναι που οι ερευνητές επικεντρωθεί. Η κατανομή των απαντήσεων είναι σημαντική να εξεταστεί και η SD παρέχει ένα πολύτιμο περιγραφικό μέτρο γι 'αυτό. Απάντηση Καλή αξία για τα χρήματα Αξιοπιστία προϊόντος

3

1

D

3 1 Ε
4 5 Η
3 5 I
3 5 J
3 5 2
3. 4 Std. Dev. 0. 4
2. 1 Πρώτη Έρευνα: Οι ερωτηθέντες βαθμολογούν ένα προϊόν σε κλίμακα 5 σημείων Δύο πολύ διαφορετικές κατανομές απαντήσεων σε κλίμακα βαθμολόγησης 5 σημείων μπορούν να αποδώσουν τον ίδιο μέσο. Εξετάστε το ακόλουθο παράδειγμα που δείχνει τις τιμές απόκρισης για δύο διαφορετικές αξιολογήσεις.
Στο πρώτο παράδειγμα (Βαθμός "Α"), το SD είναι μηδέν επειδή όλες οι απαντήσεις ήταν ακριβώς η μέση τιμή. Οι ατομικές απαντήσεις δεν αποκλίνουν καθόλου από τον μέσο όρο. Στην Αξιολόγηση "Β", παρόλο που η μέση τιμή της ομάδας είναι η ίδια (3. 0) ως η πρώτη κατανομή, η Τυπική Απόκλιση είναι υψηλότερη. Η τυπική απόκλιση του 1.15 δείχνει ότι οι μεμονωμένες απαντήσεις, κατά μέσο όρο *, ήταν λίγο πάνω από 1 βαθμός από το μέσο όρο. Απάντηση
Αξιολόγηση "A" Αξιολόγηση "B" A
3 1 B
3 2 C
3 3 3
3 3 3

3

3

3

> 3

Η 3 4
I 3 4
3 5
0 3. 0 Std. Dev.
0. 00 1. 15 Δεύτερη έρευνα: Οι ερωτηθέντες βαθμολογούν ένα προϊόν σε μια κλίμακα 5 σημείων
Ένας άλλος τρόπος να εξετάσουμε το SD είναι να σχεδιάσουμε τη διανομή ως ιστόγραμμα απαντήσεων. Μια κατανομή με χαμηλή τιμή SD θα εμφανίζεται ως ένα υψηλό στενό σχήμα, ενώ ένα μεγάλο SD θα υποδεικνύεται από ένα ευρύτερο σχήμα. Το SD γενικά δεν δείχνει "σωστό ή λάθος" ή "καλύτερο ή χειρότερο" - μια χαμηλότερη τιμή SD δεν είναι αναγκαστικά πιο επιθυμητή. Χρησιμοποιείται αποκλειστικά ως περιγραφικό στατιστικό στοιχείο. Περιγράφει την κατανομή σε σχέση με τον μέσο όρο. T
τεχνική αποποίηση ευθύνης σχετικά με το SD Η σκέψη της SD ως "μέσης απόκλισης" είναι ένας εξαιρετικός τρόπος για την κατανόηση της έννοιας της έννοιας. Ωστόσο, δεν υπολογίζεται στην πραγματικότητα ως μέσος όρος (αν ήταν, θα το ονομάζαμε "μέση απόκλιση"). Αντίθετα, είναι "τυποποιημένη", μια κάπως πολύπλοκη μέθοδος υπολογισμού της αξίας χρησιμοποιώντας το άθροισμα των τετραγώνων. Για πρακτικούς λόγους, ο υπολογισμός δεν είναι σημαντικός. Τα περισσότερα προγράμματα καταλογογράφησης, υπολογιστικά φύλλα ή άλλα εργαλεία διαχείρισης δεδομένων θα υπολογίσουν το SD για εσάς. Πιο σημαντικό είναι να καταλάβουμε τι μεταδίδουν τα στατιστικά στοιχεία.
Πρότυπο σφάλμα Ένα τυπικό σφάλμα είναι στατιστικό inferential
που χρησιμοποιείται κατά τη σύγκριση των μέσων δειγματοληψίας (μέσοι όροι) μεταξύ των πληθυσμών. Πρόκειται για μέτρο ακρίβειας του μέσου του δείγματος. Ο μέσος δείκτης είναι στατιστική που προέρχεται από δεδομένα που έχουν υποκείμενη κατανομή. Δεν μπορούμε να την απεικονίσουμε με τον ίδιο τρόπο όπως τα δεδομένα, αφού έχουμε πραγματοποιήσει ένα μόνο πείραμα και έχουμε μόνο μία μόνο τιμή. Η στατιστική θεωρία μας λέει ότι ο μέσος δείκτης (για ένα μεγάλο δείγμα "αρκετά" και κάτω από μερικές συνθήκες κανονικότητας) κατανέμεται περίπου κανονικά. Η τυπική απόκλιση αυτής της κανονικής κατανομής είναι αυτό που ονομάζουμε τυπικό σφάλμα.
Σχήμα 2. Η κατανομή στο κάτω μέρος αντιπροσωπεύει την κατανομή των δεδομένων, ενώ η κατανομή στην κορυφή είναι η θεωρητική κατανομή του μέσου του δείγματος. Το SD του 20 είναι ένα μέτρο της εξάπλωσης των δεδομένων, ενώ η SE των 5 είναι μέτρο αβεβαιότητας γύρω από το μέσο δείγμα. Όταν θέλουμε να συγκρίνουμε τα μέσα των αποτελεσμάτων από ένα πείραμα δύο δειγμάτων της θεραπείας Α έναντι της θεραπείας Β, τότε πρέπει να υπολογίσουμε με ακρίβεια πώς μετρήσαμε τα μέσα.
Στην πραγματικότητα, μας ενδιαφέρει το πόσο ακριβώς μετρήσαμε τη διαφορά μεταξύ των δύο μέσων. Ονομάζουμε αυτό το μέτρο το τυπικό σφάλμα της διαφοράς. Μπορεί να μην εκπλαγείτε να μάθετε ότι το τυπικό σφάλμα της διαφοράς στο μέσο δείγματος είναι συνάρτηση των τυπικών σφαλμάτων των μέσων: Τώρα που έχετε καταλάβει ότι το τυπικό σφάλμα του μέσου (SE) και του η τυπική απόκλιση της κατανομής (SD) είναι δύο διαφορετικά θηρία, ίσως να αναρωτιέστε πώς έχουν μπερδευτεί στην πρώτη θέση. Ενώ διαφέρουν εννοιολογικά, έχουν μια απλή σχέση μαθηματικά: , όπου n είναι ο αριθμός των σημείων δεδομένων.
Παρατηρήστε ότι το τυπικό σφάλμα εξαρτάται από δύο συνιστώσες: την τυπική απόκλιση του δείγματος και το μέγεθος του δείγματος n . Αυτό καθιστά διαισθητική έννοια: όσο μεγαλύτερη είναι η τυπική απόκλιση του δείγματος, τόσο λιγότερο ακριβής μπορούμε να είμαστε για την εκτίμηση του πραγματικού μέσου όρου.
Επίσης, το μεγάλο μέγεθος του δείγματος, οι περισσότερες πληροφορίες που έχουμε σχετικά με τον πληθυσμό και με μεγαλύτερη ακρίβεια μπορούμε να εκτιμήσουμε τον πραγματικό μέσο όρο. Η SE είναι ένδειξη της αξιοπιστίας του μέσου όρου. Μια μικρή SE είναι μια ένδειξη ότι ο μέσος όρος του δείγματος είναι μια ακριβέστερη αντανάκλαση του πραγματικού μέσου όρου του πληθυσμού.Ένα μεγαλύτερο μέγεθος δείγματος συνήθως θα έχει ως αποτέλεσμα μικρότερο SE (ενώ το SD δεν επηρεάζεται άμεσα από το μέγεθος του δείγματος). Η πλειονότητα των ερευνητικών ερευνών περιλαμβάνει τη συγκέντρωση δείγματος από πληθυσμό. Στη συνέχεια, κάνουμε συμπεράσματα σχετικά με τον πληθυσμό από τα αποτελέσματα που προέκυψαν από αυτό το δείγμα. Εάν τραβήχτηκε ένα δεύτερο δείγμα, τα αποτελέσματα πιθανώς δεν θα αντιστοιχούν ακριβώς στο πρώτο δείγμα. Εάν η μέση τιμή για ένα χαρακτηριστικό βαθμολογίας ήταν 3,2 για ένα δείγμα, μπορεί να είναι 3,4 για ένα δεύτερο δείγμα ίδιου μεγέθους. Αν θέλαμε να σχεδιάσουμε έναν άπειρο αριθμό δειγμάτων (ίσου μεγέθους) από τον πληθυσμό μας, θα μπορούσαμε να δείξουμε τα παρατηρούμενα μέσα ως κατανομή. Στη συνέχεια θα μπορούσαμε να υπολογίσουμε έναν μέσο όρο όλων των δειγμάτων μας. Αυτός ο όρος θα ισοδυναμούσε με τον πραγματικό μέσο πληθυσμού. Μπορούμε επίσης να υπολογίσουμε το SD της κατανομής των μέσων δειγματοληψίας. Η SD αυτής της κατανομής του μέσου δειγματοληψίας είναι η SE κάθε μέσου όρου του δείγματος.

Εμείς, λοιπόν, έχουμε την πιο σημαντική παρατήρησή μας:

SE είναι η SD του μέσου όρου του πληθυσμού.

Δείγμα

Μέση 1η

3. 2

3. 4

3. 33. 2

3. 1 …. ….

….

….

….

….

…. …. ….

….

Μέση

3. 3

Std. Dev. 0. 13

Πίνακας που απεικονίζει τη σχέση μεταξύ SD και SE Είναι πλέον σαφές ότι εάν η SD αυτής της διανομής μας βοηθά να κατανοήσουμε πόσο ένα δείγμα σημαίνει από τον πραγματικό πληθυσμό, τότε μπορούμε να το χρησιμοποιήσουμε για να καταλάβουμε πώς ακριβής ο κάθε μεμονωμένος μέσος δείκτης είναι σε σχέση με τον πραγματικό μέσο όρο. Αυτή είναι η ουσία της SE.
Στην πραγματικότητα, αντλήσαμε μόνο ένα δείγμα από τον πληθυσμό μας, αλλά μπορούμε να χρησιμοποιήσουμε αυτό το αποτέλεσμα για να παράσχουμε μια εκτίμηση της αξιοπιστίας του παρατηρούμενου δείγματος μας.
Στην πραγματικότητα, η SE μας λέει ότι μπορούμε να είμαστε 95% σίγουροι ότι ο παρατηρούμενος μέσος δείκτης είναι συν ή μείον περίπου 2 (στην πραγματικότητα 1,96) τυποποιημένων σφαλμάτων από τον μέσο όρο του πληθυσμού. Ο παρακάτω πίνακας δείχνει την κατανομή των απαντήσεων από το πρώτο (και μόνο) δείγμα που χρησιμοποιήσαμε για την έρευνά μας. Το SE του 13, που είναι σχετικά μικρό, μας δίνει μια ένδειξη ότι ο μέσος όρος μας είναι σχετικά κοντά στον πραγματικό μέσο όρο του συνολικού μας πληθυσμού. Το περιθώριο σφάλματος (σε εμπιστοσύνη 95%) για το μέσο όρο μας είναι (περίπου) διπλάσιο από την τιμή (+/- 0,26), λέγοντας ότι ο πραγματικός μέσος όρος πιθανότατα είναι μεταξύ 2. 94 και 3. 46.
3
D 3
E 3
4
F 4
G 3
H 3
> 3. 2 Std. Err
0. 13

Περίληψη

Πολλοί ερευνητές δεν κατανοούν τη διάκριση μεταξύ τυπικής απόκλισης και τυπικού σφάλματος, παρόλο που συνήθως περιλαμβάνονται στην ανάλυση δεδομένων. Ενώ οι πραγματικοί υπολογισμοί για την τυπική απόκλιση και το τυπικό σφάλμα μοιάζουν πολύ παρόμοιοι, αντιπροσωπεύουν δύο πολύ διαφορετικά αλλά συμπληρωματικά μέτρα. Η SD μας λέει για το σχήμα της κατανομής μας, πόσο κοντά είναι οι τιμές μεμονωμένων δεδομένων από τη μέση τιμή. Η SE μας λέει πόσο κοντά είναι το δείγμα μας στο πραγματικό μέσο όρο του συνολικού πληθυσμού.Μαζί, συμβάλλουν στην παροχή μιας πληρέστερης εικόνας από ό, τι ο μόνος που μπορεί να μας πει.