Διαφορά μεταξύ T-TEST και ANOVA Διαφορά μεταξύ

Anonim

T-TEST vs. ANOVA

Η συλλογή και υπολογισμός στατιστικών δεδομένων για την απόκτηση του μέσου είναι συχνά μια μακρά και κουραστική διαδικασία. Το t-test και η μονόδρομη ανάλυση της διακύμανσης (ANOVA) είναι οι δύο συνηθέστερες δοκιμασίες που χρησιμοποιούνται για το σκοπό αυτό.

Η t-test είναι μια δοκιμή στατιστικής υπόθεσης όπου το στατιστικό αποτέλεσμα της δοκιμής ακολουθεί τη διανομή του σπουδαστή σε περίπτωση που υποστηρίζεται η μηδενική υπόθεση. Η δοκιμή αυτή εφαρμόζεται όταν το στατιστικό αποτέλεσμα της δοκιμής ακολουθεί κανονική κατανομή και είναι γνωστή η τιμή ενός όρου κλιμάκωσης στην στατιστική δοκιμής. Αν ο όρος κλιμάκωσης είναι άγνωστος, τότε αντικαθίσταται από μια εκτίμηση βάσει των διαθέσιμων δεδομένων. Το στατιστικό αποτέλεσμα της δοκιμής θα ακολουθήσει τη διανομή του Student.

William Sealy Gosset εισήγαγε το t-στατιστικό το 1908. Ο Gosset ήταν χημικός για το ζυθοποιείο Guinness στο Δουβλίνο της Ιρλανδίας. Το ζυθοποιείο Guinness είχε την πολιτική να στρατολογήσει τους καλύτερους αποφοίτους από την Οξφόρδη και το Cambridge, επιλέγοντας από εκείνους που θα μπορούσαν να παρέχουν εφαρμογές βιοχημείας και στατιστικών στοιχείων στις καθιερωμένες βιομηχανικές διαδικασίες της εταιρείας. Ο William Sealy Gosset ήταν ένας τέτοιος πτυχιούχος. Στη διαδικασία, ο William Sealy Gosset επινόησε το t-test, το οποίο αρχικά θεωρήθηκε ως ένας τρόπος για την παρακολούθηση της ποιότητας του stout (η σκοτεινή μπύρα που παράγει το ζυθοποιείο) με οικονομικά αποδοτικό τρόπο. Ο Gosset δημοσίευσε τη δοκιμασία με την ονομασία «Student» στο Biometrika, περίπου το 1908. Ο λόγος για το όνομα της μάρκας ήταν η επιμονή του Guinness, καθώς η εταιρεία θέλησε να διατηρήσει την πολιτική της σχετικά με τη χρήση στατιστικών στοιχείων ως μέρος των «εμπορικών μυστικών».

Τα στατιστικά στοιχεία T-test ακολουθούν γενικά τη μορφή T = Z / s, όπου τα Z και s είναι λειτουργίες των δεδομένων. Η μεταβλητή Ζ σχεδιάζεται να είναι ευαίσθητη στην εναλλακτική υπόθεση. αποτελεσματικά, το μέγεθος της μεταβλητής Ζ είναι μεγαλύτερο όταν ισχύει η εναλλακτική υπόθεση. Εν τω μεταξύ, το 's' είναι μια παράμετρος κλιμάκωσης, επιτρέποντας τον προσδιορισμό της κατανομής του Τ. Οι υποθέσεις στις οποίες βασίζεται μια t-δοκιμή είναι ότι a) το Z ακολουθεί μια τυποποιημένη κανονική κατανομή υπό την null υπόθεση. β) το ps2 ακολουθεί μια κατανομή Ï ‡ 2 με p βαθμούς ελευθερίας κάτω από την μηδενική υπόθεση (όπου p είναι θετική σταθερά). και γ) η τιμή Ζ και η τιμή είναι ανεξάρτητες. Σε έναν συγκεκριμένο τύπο t-test, αυτές οι συνθήκες είναι συνέπειες του πληθυσμού που μελετάται, καθώς και ο τρόπος δειγματοληψίας των δεδομένων.

Από την άλλη πλευρά, η ανάλυση της διακύμανσης (ANOVA) είναι μια συλλογή στατιστικών μοντέλων. Ενώ οι αρχές της ANOVA έχουν χρησιμοποιηθεί από ερευνητές και στατιστικολόγους για μεγάλο χρονικό διάστημα, μέχρι το 1918 ο Sir Ronald Fisher υπέβαλε πρόταση να επισημοποιήσει την ανάλυση της διακύμανσης σε ένα άρθρο με τίτλο «Η σχέση μεταξύ συγγενών σχετικά με την υπόνοια της Mendelian κληρονομιάς»,.Έκτοτε, η ANOVA επεκτάθηκε στο πεδίο εφαρμογής και την εφαρμογή της. Η ANOVA είναι στην πραγματικότητα μια εσφαλμένη ονομασία, καθώς δεν προέρχεται από τις διαφορές των αποκλίσεων αλλά από τις διαφορές μεταξύ των μέσων των ομάδων. Περιλαμβάνει τις σχετικές διαδικασίες όπου η παρατηρούμενη διακύμανση σε μια συγκεκριμένη μεταβλητή χωρίζεται σε συστατικά που αποδίδονται σε διαφορετικές πηγές παραλλαγής.

Βασικά, μια ANOVA παρέχει μια στατιστική δοκιμασία για να προσδιορίσει εάν τα μέσα πολλών ομάδων είναι όλα ίσα και, ως εκ τούτου, γενικεύει t-test σε περισσότερες από δύο ομάδες. Ένα ANOVA μπορεί να είναι πιο χρήσιμο από ένα t-test δύο δειγμάτων, καθώς έχει λιγότερες πιθανότητες να διαπράξει σφάλμα τύπου Ι. Για παράδειγμα, η ύπαρξη πολλαπλών t-δοκιμών δύο δειγμάτων θα είχε μεγαλύτερη πιθανότητα να διαπράξει σφάλμα απ 'ό, τι ένα ANOVA των ίδιων μεταβλητών που εμπλέκονται για να αποκτήσουν τον μέσο όρο. Το μοντέλο είναι το ίδιο και η στατιστική δοκιμής είναι η αναλογία F. Με απλούστερους όρους, οι t-tests είναι απλώς μια ειδική περίπτωση του ANOVA: κάνοντας μια ANOVA θα έχει το ίδιο αποτέλεσμα πολλαπλών t-δοκιμών. Υπάρχουν τρεις κατηγορίες μοντέλων ANOVA: α) Μοντέλα σταθερών αποτελεσμάτων που υποθέτουν ότι τα δεδομένα προέρχονται από φυσιολογικούς πληθυσμούς, που διαφέρουν μόνο από τα μέσα τους. β) Τα μοντέλα τυχαίων αποτελεσμάτων που αναλαμβάνουν τα δεδομένα περιγράφουν μια ιεραρχία διαφόρων πληθυσμών των οποίων οι διαφορές περιορίζονται από την ιεραρχία. και γ) μοντέλα μικτού αποτελέσματος που είναι καταστάσεις όπου υπάρχουν τόσο σταθερά όσο και τυχαία αποτελέσματα.

Περίληψη:

Η t-test χρησιμοποιείται όταν καθορίζεται κατά πόσο δύο μέσοι όροι ή μέσα είναι ίδιοι ή διαφορετικοί. Το ANOVA προτιμάται όταν συγκρίνεται τρεις ή περισσότεροι μέσοι όροι ή μέσα.

  1. Μια t-test έχει περισσότερες πιθανότητες να διαπράξει σφάλμα, όσο περισσότερο χρησιμοποιούνται, γι 'αυτό χρησιμοποιείται το ANOVA κατά τη σύγκριση δύο ή περισσότερων μέσων.