Διαφορά μεταξύ της απόκλισης και της διαφοράς

Anonim

Απόκλιση vs Covariance

Η διακύμανση και η συνδιακύμανση είναι δύο μέτρα που χρησιμοποιούνται στις στατιστικές. Η απόκλιση είναι ένα μέτρο της διασποράς των δεδομένων και η συνδιακύμανση δείχνει το βαθμό αλλαγής δύο τυχαίων μεταβλητών μαζί. Η απόκλιση είναι μάλλον μια διαισθητική αντίληψη, αλλά η συνδιακύμανση ορίζεται μαθηματικά σε όχι τόσο διαισθητική στην αρχή.

Περισσότερα για την Απόκλιση

Η διακύμανση είναι μέτρο διασποράς των δεδομένων από τη μέση τιμή της κατανομής. Αναφέρει πόσο μακριά βρίσκονται τα σημεία δεδομένων από τον μέσο της κατανομής. Είναι ένας από τους βασικούς περιγραφείς της κατανομής πιθανοτήτων και μιας από τις στιγμές της κατανομής. Επίσης, η διακύμανση είναι μια παράμετρος του πληθυσμού και η διακύμανση ενός δείγματος από τον πληθυσμό δρα ως εκτιμητής για τη διακύμανση του πληθυσμού. Από μία άποψη, ορίζεται ως το τετράγωνο της τυπικής απόκλισης.

Σε απλή γλώσσα, μπορεί να περιγραφεί ως ο μέσος όρος των τετραγώνων της απόστασης μεταξύ κάθε σημείου δεδομένων και του μέσου όρου της κατανομής. Χρησιμοποιείται ο ακόλουθος τύπος για τον υπολογισμό της διακύμανσης.

Var (X) = E [(X-μ) 2 ] για έναν πληθυσμό και < >] για ένα δείγμα

Μπορεί επίσης να απλοποιηθεί για να δώσει Var (X) = E [X 2 ] - (E [X])

2 . Η διακύμανση έχει ορισμένες ιδιότητες υπογραφής και χρησιμοποιείται συχνά στα στατιστικά στοιχεία για να καταστήσει τη χρήση απλούστερη. Η απόκλιση είναι μη αρνητική επειδή είναι το τετράγωνο των αποστάσεων. Ωστόσο, το εύρος της διακύμανσης δεν περιορίζεται και εξαρτάται από τη συγκεκριμένη κατανομή. Η διακύμανση μιας σταθερής τυχαίας μεταβλητής είναι μηδέν και η διακύμανση δεν αλλάζει σε σχέση με την παράμετρο της θέσης.

Περισσότερα για το Covariance

Στη στατιστική θεωρία, η συνδιακύμανση είναι ένα μέτρο της μεταβολής των δύο τυχαίων μεταβλητών. Με άλλα λόγια, η συνδιακύμανση είναι ένα μέτρο της δύναμης της συσχέτισης μεταξύ δύο τυχαίων μεταβλητών. Επίσης, μπορεί να θεωρηθεί ως γενίκευση της έννοιας της διακύμανσης δύο τυχαίων μεταβλητών.

Η συνάρτηση των δύο τυχαίων μεταβλητών X και Y, οι οποίες κατανέμονται από κοινού με πεπερασμένη δεύτερη ορμή, είναι γνωστή ως σ

XY

= E [(X-E [X]) Y-E [Y]). Από αυτό, η διακύμανση μπορεί να θεωρηθεί ως μια ειδική περίπτωση συνδιακύμανσης, όπου δύο μεταβλητές είναι οι ίδιες. Για να ορίσουμε την συνδιακύμανση, ο συντελεστής γραμμικής συσχέτισης ή ο συντελεστής συσχέτισης Pearson μπορεί να ληφθεί, που ορίζεται ως ρ = Ε [(XE [X]) (YE [Y]]) / (σ

Χ σ Υ) = (Cov (X, Y)) / (σ X σ Y ) Γραφικά, η συνδιακύμανση μεταξύ ενός ζεύγους σημείων δεδομένων μπορεί να θεωρηθεί ως η περιοχή του ορθογωνίου με τα σημεία δεδομένων στις αντίθετες κορυφές.Μπορεί να ερμηνευθεί ως ένα μέτρο μεγέθους διαχωρισμού μεταξύ των δύο σημείων δεδομένων. Λαμβάνοντας υπόψη τα ορθογώνια για ολόκληρο τον πληθυσμό, η επικάλυψη των ορθογωνίων που αντιστοιχεί σε όλα τα σημεία δεδομένων μπορεί να θεωρηθεί ως η δύναμη του διαχωρισμού. διακύμανση των δύο μεταβλητών. Το Covariance είναι σε δύο διαστάσεις, λόγω των δύο μεταβλητών, αλλά απλοποιώντας το σε μία μεταβλητή, δίνει τη διακύμανση ενός ενιαίου ως διαχωρισμό σε μία διάσταση. Ποια είναι η διαφορά μεταξύ του Variance και του Covariance; • Η απόκλιση είναι το μέτρο της εξάπλωσης / διασποράς σε έναν πληθυσμό, ενώ η συνδιακύμανση θεωρείται ως μέτρο της μεταβολής των δύο τυχαίων μεταβλητών ή της ισχύος του συσχετισμού. • Η παραλλαγή μπορεί να θεωρηθεί ως μια ειδική περίπτωση συνδιακύμανσης.

• Η διακύμανση και η συνδιακύμανση εξαρτώνται από το μέγεθος των τιμών δεδομένων και δεν μπορούν να συγκριθούν. επομένως, κανονικοποιούνται. Το Covariance κανονικοποιείται στον συντελεστή συσχέτισης (διαιρώντας με το προϊόν τις τυπικές αποκλίσεις των δύο τυχαίων μεταβλητών) και η διακύμανση κανονικοποιείται στην τυπική απόκλιση (παίρνοντας την τετραγωνική ρίζα)