Το κριτήριο του Fisher είναι πίνακας και υπολογισμένο. Το ακριβές κριτήριο του Fisher

10.07.2019

Επιστρέφει το αντίστροφο της κατανομής πιθανότητας F (δεξιά ουρά). Αν p = FRIST(x;...), τότε FRIST(p;...) = x.

Η κατανομή F μπορεί να χρησιμοποιηθεί σε μια δοκιμή F, η οποία συγκρίνει τον βαθμό διασποράς δύο συνόλων δεδομένων. Για παράδειγμα, μπορείτε να αναλύσετε την κατανομή εισοδήματος των Ηνωμένων Πολιτειών και του Καναδά για να προσδιορίσετε εάν οι δύο χώρες είναι παρόμοιες όσον αφορά την πυκνότητα εισοδήματος.

Σπουδαίος:Αυτή η δυνατότητα έχει αντικατασταθεί από μία ή περισσότερες νέες δυνατότητες που παρέχουν μεγαλύτερη ακρίβεια και έχουν ονόματα που αντικατοπτρίζουν καλύτερα τον σκοπό τους. Αν και αυτή η δυνατότητα εξακολουθεί να χρησιμοποιείται για συμβατότητα προς τα πίσω, ενδέχεται να μην είναι πλέον διαθέσιμη σε μελλοντικές εκδόσεις του Excel, επομένως συνιστούμε να χρησιμοποιήσετε τις νέες δυνατότητες.

Για να μάθετε περισσότερα σχετικά με τις νέες λειτουργίες, ανατρέξτε στα άρθρα F.REV Function και F.REV.PH Function.

Σύνταξη

FRIST(πιθανότητα,βαθμοί_ελευθερίας1,βαθμοί_ελευθερίας2)

Τα ορίσματα για τη συνάρτηση FALTER περιγράφονται παρακάτω.

Πιθανότητα- απαιτούμενο επιχείρημα. Πιθανότητα που σχετίζεται με τη αθροιστική κατανομή F.

Βαθμοί_ελευθερίας1- απαιτούμενο επιχείρημα. Αριθμητής βαθμών ελευθερίας.

Βαθμοί_ελευθερίας2- απαιτούμενο επιχείρημα. Παρονομαστής βαθμών ελευθερίας.

Σημειώσεις

Εάν κάποιο από τα ορίσματα δεν είναι αριθμός, το FRATE επιστρέφει την τιμή σφάλματος #VALUE!

Αν "πιθανότητα"< 0 или "вероятность" >1, η συνάρτηση FRIST επιστρέφει την τιμή σφάλματος #NUM!.

Εάν η τιμή των βαθμών_ελευθερίας1 ή βαθμών_ελευθερίας2 δεν είναι ακέραιος, περικόπτεται.

Αν "grades_freedom1"< 1 или "степени_свободы1" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

Αν "degrees_freedom2"< 1 или "степени_свободы2" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

Η συνάρτηση FDIST μπορεί να χρησιμοποιηθεί για τον προσδιορισμό των κρίσιμων τιμών της κατανομής F. Για παράδειγμα, τα αποτελέσματα ANOVA τυπικά περιλαμβάνουν δεδομένα για τη στατιστική F, την πιθανότητα F και την κρίσιμη τιμή της κατανομής F σε επίπεδο σημαντικότητας 0,05. Για να προσδιορίσετε την κρίσιμη τιμή του F, πρέπει να χρησιμοποιήσετε το επίπεδο σημαντικότητας ως όρισμα πιθανότητας της συνάρτησης FDIST.

Με δεδομένη μια τιμή πιθανότητας, η συνάρτηση FDIST αναζητά μια τιμή x για την οποία FDIST(x,βαθμοί_ελευθερίας1,βαθμοί_ελευθερίας2) = πιθανότητα. Έτσι, η ακρίβεια της συνάρτησης FDIST εξαρτάται από την ακρίβεια της FDIST. Για την αναζήτηση, η συνάρτηση FRIST χρησιμοποιεί μια μέθοδο επανάληψης. Εάν η αναζήτηση δεν τελειώσει μετά από 100 επαναλήψεις, επιστρέφεται η τιμή σφάλματος #N/A.

Παράδειγμα

Αντιγράψτε το δείγμα δεδομένων από τον παρακάτω πίνακα και επικολλήστε το στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για να εμφανίσετε τα αποτελέσματα των τύπων, επιλέξτε τους και πατήστε F2 και μετά πατήστε Enter. Εάν είναι απαραίτητο, αλλάξτε το πλάτος των στηλών για να δείτε όλα τα δεδομένα.

Σκοπός.Έλεγχος της υπόθεσης ότι δύο διακυμάνσεις ανήκουν στον ίδιο γενικό πληθυσμό και, επομένως, η ισότητά τους.

Μηδενική υπόθεση. S 2 2 = S 1 2

Εναλλακτική υπόθεση. Υπάρχουν οι ακόλουθες επιλογές για το N A, ανάλογα με τις οποίες διαφέρουν οι κρίσιμες περιοχές:

1. S 1 2 > S 2 2 . Η πιο συχνά χρησιμοποιούμενη επιλογή είναι το H A. Η κρίσιμη περιοχή είναι η άνω ουρά της κατανομής F.

2. S 1 2< S 2 2 . Критическая область - нижний хвост F-распределения. Ввиду частого отсутствия нижнего хвоста, в таблицах критическую область обычно сводят к варианту 1, меняя местами дисперсии.

3. Διπλής όψης S 1 2 ≠S 2 2. Συνδυασμός των δύο πρώτων.

Προαπαιτούμενα.Τα δεδομένα είναι ανεξάρτητα και διανέμονται κανονικά. Η υπόθεση ότι οι διακυμάνσεις δύο κανονικών πληθυσμών είναι ίσες γίνεται αποδεκτή εάν η αναλογία της μεγαλύτερης προς τη μικρότερη είναι μικρότερη από την κρίσιμη τιμή της κατανομής Fisher.

F P = S 1 2 /S 2 2

Σημείωση. Με την περιγραφόμενη μέθοδο επαλήθευσης, η τιμή του Fpasch πρέπει απαραίτητα να είναι μεγαλύτερη από ένα. Το κριτήριο είναι ευαίσθητο στην παραβίαση της υπόθεσης κανονικότητας.

Για μια εναλλακτική διπλής όψης S 1 2 ≠S 2 2 η μηδενική υπόθεση γίνεται αποδεκτή εάν πληρούται η συνθήκη:

F l - α /2< Fрасч < F α /2

Παράδειγμα

Οι θερμοφυσικές παράμετροι προσδιορίστηκαν χρησιμοποιώντας μια σύνθετη θερμομετρική μέθοδο. χαρακτηριστικά (TFC) της πράσινης βύνης. Για την προετοιμασία των δειγμάτων, λάβαμε ξηρή βύνη (μέση υγρασία W=19%) και υγρή βύνη τεσσάρων ημερών (W=45%) σύμφωνα με τη νέα τεχνολογία παρασκευής βύνης καραμέλας. Πειράματα έδειξαν ότι η θερμική αγωγιμότητα λ της υγρής βύνης είναι περίπου 2,5 φορές μεγαλύτερη από αυτή της ξηρής βύνης και η ογκομετρική θερμοχωρητικότητα δεν εξαρτάται από την περιεκτικότητα σε υγρασία της βύνης. Επομένως, χρησιμοποιώντας τη δοκιμή F, ελέγξαμε τη δυνατότητα γενίκευσης δεδομένων με βάση τις μέσες τιμές χωρίς να λάβουμε υπόψη την υγρασία

Τα υπολογισμένα δεδομένα συνοψίζονται στον πίνακα 5.1

Πίνακας 5.1

Στοιχεία για τον υπολογισμό του κριτηρίου F

Μια μεγαλύτερη τιμή διασποράς λήφθηκε για W=45%, δηλ. S 2 45 = S 1 2 , S 2 19 = S 2 2, και F P = S 1 2 /S 2 2 = 1,35. Από τον Πίνακα 5.2 για το βαθμό ελευθερίας f 1 =N 1 -1=5 f 2 =N 2 -1=4 στο γ=0,95 προσδιορίζουμε F KR =6,2. Η μηδενική υπόθεση διατυπώθηκε ως «Στο εύρος της περιεκτικότητας σε υγρασία της πράσινης βύνης από 19 έως 45%, η επιρροή της στην ογκομετρική θερμοχωρητικότητα μπορεί να παραμεληθεί» ή «S 2 45 = S 2 19 » με πιθανότητα εμπιστοσύνης 95% ήταν επιβεβαιώθηκε, αφού το Fp

Ένα παράδειγμα δοκιμής μιας υπόθεσης σχετικά με την αναγωγή δύο διακυμάνσεων στον ίδιο πληθυσμό χρησιμοποιώντας το κριτήριο Fisher χρησιμοποιώντας το Excel

Παρουσιάζονται δεδομένα για δύο ανεξάρτητα δείγματα (Πίνακας 5.2) του βαθμού απορρόφησης νερού του κόκκου σιταριού Διεξήχθη μελέτη των επιδράσεων των μαγνητικών πεδίων χαμηλής συχνότητας.

Πίνακας 5.2

Αποτελέσματα έρευνας

Αριθμός	Αριθμός δείγματος
εμπειρία		2 ,
	0,027	0,075
	0,036	0,4
	0,1	0,08
	0,12	0,105
	0,32	0,075
	0,45	0,12
	0,049	0,06
	0,105	0,075

Πριν ελέγξουμε την υπόθεση για την ισότητα των μέσων αυτών των δειγμάτων, είναι απαραίτητο να ελέγξουμε την υπόθεση για την ισότητα των διακυμάνσεων για να ξέρουμε ποιο κριτήριο να επιλέξουμε για να το ελέγξουμε.

Στο Σχ. Το 5.1 δείχνει ένα παράδειγμα δοκιμής της υπόθεσης ότι δύο διακυμάνσεις ανήκουν στον ίδιο πληθυσμό χρησιμοποιώντας το κριτήριο Fisher χρησιμοποιώντας το προϊόν λογισμικού Microsoft Excel.

Σχήμα 5.1 Παράδειγμα ελέγχου της αναγωγής δύο διακυμάνσεων σε έναν πληθυσμό χρησιμοποιώντας το κριτήριο Fisher

Τα δεδομένα προέλευσης βρίσκονται στα κελιά που βρίσκονται στη διασταύρωση των στηλών C και D με τις σειρές 3-10. Ας κάνουμε τα εξής:

1. Ας προσδιορίσουμε εάν ο νόμος κατανομής του πρώτου και του δεύτερου δείγματος μπορεί να θεωρηθεί κανονικός (στήλες C και D, αντίστοιχα). Εάν όχι (για τουλάχιστον ένα δείγμα), τότε είναι απαραίτητο να χρησιμοποιήσουμε μια μη παραμετρική δοκιμή, αν ναι, συνεχίζουμε.

2. Υπολογίστε τις αποκλίσεις για την πρώτη και τη δεύτερη στήλη. Για να γίνει αυτό, στα κελιά SP και D11 τοποθετούμε τις συναρτήσεις =DISP(SZ:C10) και =DISP(DЗ:D10), αντίστοιχα. Το αποτέλεσμα αυτών των συναρτήσεων είναι η υπολογισμένη τιμή διακύμανσης για κάθε στήλη, αντίστοιχα.

3. Βρείτε την υπολογιζόμενη τιμή για το κριτήριο Fisher. Για να γίνει αυτό, πρέπει να διαιρέσετε τη μεγαλύτερη διακύμανση με τη μικρότερη. Στο κελί F13 τοποθετούμε τον τύπο =C11/D11, ο οποίος εκτελεί αυτή τη λειτουργία.

4. Προσδιορίστε εάν η υπόθεση της ισότητας των αποκλίσεων μπορεί να γίνει αποδεκτή. Υπάρχουν δύο μέθοδοι, οι οποίες παρουσιάζονται στο παράδειγμα. Σύμφωνα με την πρώτη μέθοδο, ορίζοντας ένα επίπεδο σημαντικότητας, για παράδειγμα 0,05, υπολογίζεται η κρίσιμη τιμή της κατανομής Fisher για αυτήν την τιμή και ο αντίστοιχος αριθμός βαθμών ελευθερίας. Στο κελί F14, εισαγάγετε τη συνάρτηση =FPACPOBP(0,05;7;7) (όπου 0,05 είναι το καθορισμένο επίπεδο σημασίας, 7 είναι ο αριθμός των βαθμών ελευθερίας του αριθμητή και 7 (δεύτερος) είναι ο αριθμός των βαθμών ελευθερίας του ο παρονομαστής). Ο αριθμός των βαθμών ελευθερίας είναι ίσος με τον αριθμό των πειραμάτων μείον ένα. Το αποτέλεσμα είναι 3,787051. Εφόσον αυτή η τιμή είναι μεγαλύτερη από την υπολογιζόμενη τιμή του 1,81144, πρέπει να δεχτούμε τη μηδενική υπόθεση της ισότητας των διακυμάνσεων.

Σύμφωνα με τη δεύτερη επιλογή, η αντίστοιχη πιθανότητα υπολογίζεται για την υπολογισμένη τιμή του κριτηρίου Fisher. Για να το κάνετε αυτό, εισαγάγετε τη συνάρτηση =FPACP(F13,7,7) στο κελί F15. Δεδομένου ότι η προκύπτουσα τιμή 0,22566 είναι μεγαλύτερη από 0,05, η υπόθεση της ισότητας των διακυμάνσεων γίνεται αποδεκτή.

Αυτό μπορεί να γίνει με μια ειδική λειτουργία. Επιλέξτε τα στοιχεία μενού διαδοχικά Υπηρεσία , Ανάλυση δεδομένων . Θα εμφανιστεί το ακόλουθο παράθυρο (Εικ. 5.2).

Εικόνα 5.2 Παράθυρο επιλογής μεθόδου επεξεργασίας

Σε αυτό το παράθυρο επιλέξτε " Δύο δείγματα F-mecm για διακυμάνσεις " Ως αποτέλεσμα, θα εμφανιστεί ένα παράθυρο όπως φαίνεται στην Εικ. 5.3. Εδώ ορίζετε τα διαστήματα (αριθμοί κελιών) της πρώτης και δεύτερης μεταβλητής, το επίπεδο σημασίας (άλφα) και το μέρος όπου θα βρίσκεται το αποτέλεσμα.

Ρυθμίστε όλες τις απαραίτητες παραμέτρους και κάντε κλικ στο OK. Το αποτέλεσμα της εργασίας φαίνεται στο Σχ. 5.4

Πρέπει να σημειωθεί ότι η συνάρτηση ελέγχει ένα μονόπλευρο κριτήριο και το κάνει σωστά. Για την περίπτωση που η τιμή του κριτηρίου είναι μεγαλύτερη από 1, υπολογίζεται η ανώτερη κρίσιμη τιμή.

Εικόνα 5.3 Παράθυρο ρύθμισης παραμέτρων

Όταν η τιμή του κριτηρίου είναι μικρότερη από 1, υπολογίζεται η χαμηλότερη κρίσιμη τιμή.

Υπενθυμίζουμε ότι η υπόθεση της ισότητας των αποκλίσεων απορρίπτεται εάν η τιμή του κριτηρίου είναι μεγαλύτερη από την ανώτερη κρίσιμη τιμή ή μικρότερη από την κατώτερη.

Εικόνα 5.4 Έλεγχος για ισότητα διακυμάνσεων

Το ακριβές τεστ Fisher είναι ένα κριτήριο που χρησιμοποιείται για τη σύγκριση δύο σχετικών δεικτών που χαρακτηρίζουν τη συχνότητα ενός συγκεκριμένου χαρακτηριστικού που έχει δύο τιμές. Τα αρχικά δεδομένα για τον υπολογισμό της ακριβούς δοκιμής του Fisher συνήθως ομαδοποιούνται με τη μορφή πίνακα τεσσάρων πεδίων.

1. Ιστορικό ανάπτυξης του κριτηρίου

Το κριτήριο προτάθηκε για πρώτη φορά Ρόναλντ Φίσερστο βιβλίο του Design of Experiments. Αυτό συνέβη το 1935. Ο ίδιος ο Fischer ισχυρίστηκε ότι η Muriel Bristol τον ώθησε σε αυτή την ιδέα. Στις αρχές της δεκαετίας του 1920, ο Ronald, η Muriel και ο William Roach τοποθετήθηκαν στην Αγγλία σε έναν αγροτικό πειραματικό σταθμό. Η Muriel ισχυρίστηκε ότι μπορούσε να καθορίσει τη σειρά με την οποία χύνονταν το τσάι και το γάλα στο φλιτζάνι της. Τότε δεν κατέστη δυνατό να εξακριβωθεί η ορθότητα της δήλωσής της.

Αυτό οδήγησε στην ιδέα του Fisher για την «μηδενική υπόθεση». Ο στόχος δεν ήταν να αποδειχθεί ότι η Muriel μπορούσε να διακρίνει τη διαφορά ανάμεσα σε διαφορετικά παρασκευασμένα φλιτζάνια τσαγιού. Αποφασίστηκε να διαψευσθεί η υπόθεση ότι μια γυναίκα κάνει μια επιλογή τυχαία. Διαπιστώθηκε ότι η μηδενική υπόθεση δεν μπορούσε ούτε να αποδειχθεί ούτε να δικαιολογηθεί. Αλλά μπορεί να διαψευσθεί κατά τη διάρκεια πειραμάτων.

Ετοιμάστηκαν 8 φλιτζάνια. Τα πρώτα τέσσερα γεμίζονται πρώτα με γάλα, τα άλλα τέσσερα με τσάι. Τα κύπελλα ήταν ανακατεμένα. Ο Μπρίστολ προσφέρθηκε να δοκιμάσει το τσάι και να μοιράσει τα φλιτζάνια σύμφωνα με τη μέθοδο παρασκευής του τσαγιού. Το αποτέλεσμα θα έπρεπε να ήταν δύο ομάδες. Η ιστορία λέει ότι το πείραμα ήταν επιτυχημένο.

Χάρη στη δοκιμή Fisher, η πιθανότητα ότι το Bristol ενεργούσε διαισθητικά μειώθηκε στο 0,01428. Δηλαδή, ήταν δυνατό να αναγνωριστεί σωστά το κύπελλο σε μία περίπτωση από τις 70. Ωστόσο, δεν υπάρχει τρόπος να μηδενιστούν οι πιθανότητες που καθορίζει τυχαία η Μαντάμ. Ακόμα κι αν αυξήσετε τον αριθμό των φλιτζανιών.

Αυτή η ιστορία έδωσε ώθηση στην ανάπτυξη της «μηδενικής υπόθεσης». Ταυτόχρονα, προτάθηκε το ακριβές κριτήριο του Fisher, η ουσία του οποίου είναι να απαριθμήσει όλους τους πιθανούς συνδυασμούς εξαρτημένων και ανεξάρτητων μεταβλητών.

2. Σε τι χρησιμεύει το ακριβές τεστ Fisher;

Το ακριβές τεστ Fisher χρησιμοποιείται κυρίως για σύγκριση μικρά δείγματα. Υπάρχουν δύο καλοί λόγοι για αυτό. Πρώτον, ο υπολογισμός του κριτηρίου είναι αρκετά επαχθής και μπορεί να διαρκέσει πολύ ή να απαιτήσει ισχυρούς υπολογιστικούς πόρους. Δεύτερον, το κριτήριο είναι αρκετά ακριβές (κάτι που αντικατοπτρίζεται ακόμη και στο όνομά του), γεγονός που επιτρέπει τη χρήση του σε μελέτες με μικρό αριθμό παρατηρήσεων.

Ιδιαίτερη θέση δίνεται στο ακριβές τεστ του Fisher στην ιατρική. Αυτή είναι μια σημαντική μέθοδος για την επεξεργασία ιατρικών δεδομένων και έχει βρει εφαρμογή σε πολλές επιστημονικές μελέτες. Χάρη σε αυτό, είναι δυνατή η μελέτη της σχέσης μεταξύ ορισμένων παραγόντων και των αποτελεσμάτων, η σύγκριση της συχνότητας των παθολογικών καταστάσεων μεταξύ δύο ομάδων ατόμων κ.λπ.

3. Σε ποιες περιπτώσεις μπορεί να χρησιμοποιηθεί το ακριβές τεστ Fisher;

Οι μεταβλητές που συγκρίνονται πρέπει να μετρώνται σε ονομαστική κλίμακακαι έχουν μόνο δύο έννοιες, για παράδειγμα, η αρτηριακή πίεση είναι φυσιολογική ή αυξημένη, το αποτέλεσμα είναι ευνοϊκό ή δυσμενές, υπάρχουν μετεγχειρητικές επιπλοκές ή όχι.
Η ακριβής δοκιμή του Fisher προορίζεται για σύγκριση δύο ανεξάρτητες ομάδες, διαιρούμενο με βάση τον παράγοντα. Κατά συνέπεια, ο παράγοντας θα πρέπει επίσης να έχει μόνο δύο πιθανές τιμές.
Το τεστ είναι κατάλληλο για σύγκριση πολύ μικρών δειγμάτων: Το ακριβές τεστ Fisher μπορεί να χρησιμοποιηθεί για την ανάλυση πινάκων τεσσάρων μερών στην περίπτωση τιμών του αναμενόμενου φαινομένου μικρότερες από 5, το οποίο αποτελεί περιορισμό για τη χρήση του Pearson chi-square. δοκιμή, ακόμη και λαμβάνοντας υπόψη τη διόρθωση του Yates.
Η ακριβής δοκιμή του Fisher μπορεί να είναι μονόπλευρη και διπλή. Με μια μονόπλευρη επιλογή, είναι γνωστό ακριβώς πού θα αποκλίνει ένας από τους δείκτες. Για παράδειγμα, μια μελέτη συγκρίνει πόσοι ασθενείς ανάρρωσαν σε σύγκριση με μια ομάδα ελέγχου. Θεωρείται ότι η θεραπεία δεν μπορεί να επιδεινώσει την κατάσταση των ασθενών, αλλά μόνο είτε να τη θεραπεύσει είτε όχι.
Μια δοκιμή δύο ουρών αξιολογεί τις διαφορές συχνότητας σε δύο κατευθύνσεις. Δηλαδή, αξιολογείται η πιθανότητα τόσο υψηλότερης όσο και χαμηλότερης συχνότητας του φαινομένου στην πειραματική ομάδα σε σύγκριση με την ομάδα ελέγχου.

Ένα ανάλογο της ακριβούς δοκιμής του Fisher είναι το Pearson chi-square test, ενώ το ακριβές τεστ Fisher έχει υψηλότερη ισχύ, ειδικά όταν συγκρίνει μικρά δείγματα, και ως εκ τούτου έχει ένα πλεονέκτημα σε αυτή την περίπτωση.

4. Πώς να υπολογίσετε το ακριβές τεστ του Fisher;

Ας υποθέσουμε ότι μελετάμε την εξάρτηση της συχνότητας γεννήσεων παιδιών με συγγενείς δυσπλασίες (CDD) από το κάπνισμα της μητέρας κατά τη διάρκεια της εγκυμοσύνης. Για αυτό, επιλέχθηκαν δύο ομάδες εγκύων γυναικών, εκ των οποίων η μία ήταν μια πειραματική ομάδα, αποτελούμενη από 80 γυναίκες που κάπνιζαν στο πρώτο τρίμηνο της εγκυμοσύνης και η δεύτερη ήταν μια ομάδα σύγκρισης, συμπεριλαμβανομένων 90 γυναικών που ακολουθούσαν έναν υγιεινό τρόπο ζωής κατά τη διάρκεια της εγκυμοσύνης. Ο αριθμός των περιπτώσεων εμβρυϊκής συγγενούς δυσπλασίας που προσδιορίστηκε με δεδομένα υπερήχων στην πειραματική ομάδα ήταν 10, στην ομάδα σύγκρισης - 2.

Πρώτα συνθέτουμε πίνακας έκτακτης ανάγκης τεσσάρων πεδίων:

Η ακριβής δοκιμή Fisher υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

όπου N είναι ο συνολικός αριθμός των θεμάτων σε δύο ομάδες. ! - παραγοντικό, που είναι το γινόμενο ενός αριθμού και μιας ακολουθίας αριθμών, καθένας από τους οποίους είναι μικρότερος από τον προηγούμενο κατά 1 (για παράδειγμα, 4! = 4 3 2 1)

Ως αποτέλεσμα των υπολογισμών, βρίσκουμε ότι P = 0,0137.

5. Πώς να ερμηνεύσετε την τιμή της ακριβούς δοκιμής του Fisher;

Το πλεονέκτημα της μεθόδου είναι ότι το κριτήριο που προκύπτει αντιστοιχεί στην ακριβή τιμή του επιπέδου σημαντικότητας Π. Δηλαδή, η τιμή 0,0137 που λήφθηκε στο παράδειγμά μας είναι το επίπεδο σημαντικότητας των διαφορών μεταξύ των συγκριτικών ομάδων στη συχνότητα ανάπτυξης συγγενών δυσπλασιών του εμβρύου. Είναι απαραίτητο μόνο να συγκριθεί αυτός ο αριθμός με το κρίσιμο επίπεδο σημαντικότητας, που συνήθως λαμβάνεται στην ιατρική έρευνα ως 0,05.

Εάν η τιμή της ακριβούς δοκιμής του Fisher είναι μεγαλύτερη από την κρίσιμη τιμή, γίνεται αποδεκτή μηδενική υπόθεσηκαι συμπεραίνεται ότι δεν υπάρχουν στατιστικά σημαντικές διαφορές στην επίπτωση της έκβασης ανάλογα με την παρουσία ενός παράγοντα κινδύνου.
Εάν η τιμή της ακριβούς δοκιμής του Fisher είναι μικρότερη από την κρίσιμη, γίνεται αποδεκτή εναλλακτική υπόθεσηκαι συμπεραίνεται ότι υπάρχουν στατιστικά σημαντικές διαφορές στη συχνότητα της έκβασης ανάλογα με την έκθεση στον παράγοντα κινδύνου.

Στο παράδειγμά μας ο Π< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин στατιστικά σημαντικά υψηλότεροαπό τους μη καπνιστές.

Χρησιμοποιώντας αυτό το παράδειγμα, θα εξετάσουμε πώς αξιολογείται η αξιοπιστία της εξίσωσης παλινδρόμησης που προκύπτει. Το ίδιο τεστ χρησιμοποιείται για να ελεγχθεί η υπόθεση ότι οι συντελεστές παλινδρόμησης είναι ταυτόχρονα ίσοι με μηδέν, a=0, b=0. Με άλλα λόγια, η ουσία των υπολογισμών είναι να απαντηθεί το ερώτημα: μπορεί να χρησιμοποιηθεί για περαιτέρω ανάλυση και προβλέψεις;

Για να προσδιορίσετε εάν οι διακυμάνσεις σε δύο δείγματα είναι παρόμοιες ή διαφορετικές, χρησιμοποιήστε αυτό το t-test.

Έτσι, ο σκοπός της ανάλυσης είναι να αποκτήσει κάποια εκτίμηση με την οποία θα μπορούσε να δηλωθεί ότι σε ένα ορισμένο επίπεδο α η εξίσωση παλινδρόμησης που προκύπτει είναι στατιστικά αξιόπιστη. Για αυτό χρησιμοποιείται συντελεστής προσδιορισμού R2.
Ο έλεγχος της σημασίας ενός μοντέλου παλινδρόμησης πραγματοποιείται χρησιμοποιώντας τη δοκιμή F Fisher, η υπολογισμένη τιμή της οποίας βρίσκεται ως ο λόγος της διακύμανσης της αρχικής σειράς παρατηρήσεων του δείκτη που μελετάται και η αμερόληπτη εκτίμηση της διακύμανσης της υπολειπόμενης ακολουθίας για αυτό το μοντέλο.
Εάν η υπολογιζόμενη τιμή με k 1 =(m) και k 2 =(n-m-1) βαθμούς ελευθερίας είναι μεγαλύτερη από την πινακοποιημένη τιμή σε ένα δεδομένο επίπεδο σημασίας, τότε το μοντέλο θεωρείται σημαντικό.

όπου m είναι ο αριθμός των παραγόντων στο μοντέλο.
Η στατιστική σημασία της ζευγαρωμένης γραμμικής παλινδρόμησης αξιολογείται χρησιμοποιώντας τον ακόλουθο αλγόριθμο:
1. Προβάλλεται μηδενική υπόθεση ότι η εξίσωση στο σύνολό της είναι στατιστικά ασήμαντη: H 0: R 2 =0 στο επίπεδο σημαντικότητας α.
2. Στη συνέχεια, προσδιορίστε την πραγματική τιμή του κριτηρίου F:

όπου m=1 για παλινδρόμηση κατά ζεύγη.
3. Η πινακοποιημένη τιμή προσδιορίζεται από τους πίνακες κατανομής Fisher για ένα δεδομένο επίπεδο σημασίας, λαμβάνοντας υπόψη ότι ο αριθμός βαθμών ελευθερίας για το συνολικό άθροισμα τετραγώνων (μεγαλύτερη διακύμανση) είναι 1 και ο αριθμός βαθμών ελευθερίας για το υπόλοιπο Το άθροισμα των τετραγώνων (μικρότερη διακύμανση) στη γραμμική παλινδρόμηση είναι n-2 (ή μέσω της συνάρτησης Excel FRIST(πιθανότητα,1,n-2)).
Ο πίνακας F είναι η μέγιστη δυνατή τιμή του κριτηρίου υπό την επίδραση τυχαίων παραγόντων με δεδομένους βαθμούς ελευθερίας και επίπεδο σημαντικότητας α. Το επίπεδο σημαντικότητας α είναι η πιθανότητα απόρριψης της σωστής υπόθεσης, εφόσον είναι αληθής. Τυπικά το α λαμβάνεται ως 0,05 ή 0,01.
4. Εάν η πραγματική τιμή του F-test είναι μικρότερη από την τιμή του πίνακα, τότε λένε ότι δεν υπάρχει λόγος να απορριφθεί η μηδενική υπόθεση.
Διαφορετικά, η μηδενική υπόθεση απορρίπτεται και η εναλλακτική υπόθεση για τη στατιστική σημασία της εξίσωσης στο σύνολό της γίνεται αποδεκτή με πιθανότητα (1-α).
Τιμή πίνακα του κριτηρίου με βαθμούς ελευθερίας k 1 =1 και k 2 =48, πίνακας F = 4

συμπεράσματα: Δεδομένου ότι ο πίνακας της πραγματικής τιμής F > F, ο συντελεστής προσδιορισμού είναι στατιστικά σημαντικός ( η εκτίμηση της εξίσωσης παλινδρόμησης που βρέθηκε είναι στατιστικά αξιόπιστη) .

Ανάλυση της διακύμανσης

Δείκτες ποιότητας εξίσωσης παλινδρόμησης

Παράδειγμα. Με βάση συνολικά 25 εμπορικές επιχειρήσεις, μελετάται η σχέση μεταξύ των ακόλουθων χαρακτηριστικών: X - τιμή του προϊόντος Α, χιλιάδες ρούβλια. Y είναι το κέρδος μιας εμπορικής επιχείρησης, εκατομμύρια ρούβλια. Κατά την αξιολόγηση του μοντέλου παλινδρόμησης, προέκυψαν τα ακόλουθα ενδιάμεσα αποτελέσματα: ∑(y i -y x) 2 = 46000; ∑(y i -y μέσος όρος) 2 = 138000. Ποιος δείκτης συσχέτισης μπορεί να προσδιοριστεί από αυτά τα δεδομένα; Υπολογίστε την τιμή αυτού του δείκτη με βάση αυτό το αποτέλεσμα και χρησιμοποιώντας Τεστ F Fisherεξάγουν συμπεράσματα σχετικά με την ποιότητα του μοντέλου παλινδρόμησης.
Λύση. Από αυτά τα δεδομένα μπορούμε να προσδιορίσουμε την εμπειρική αναλογία συσχέτισης: , όπου ∑(y μέσος -y x) 2 = ∑(y i -y μέσος όρος) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92.000.
η 2 = 92.000/138000 = 0,67, η = 0,816 (0,7< η < 0.9 - связь между X и Y высокая).

Τεστ F Fisher: n = 25, m = 1.
R 2 = 1 - 46000/138000 = 0,67, F = 0,67/(1-0,67)x(25 - 1 - 1) = 46. Πίνακας F (1; 23) = 4,27
Δεδομένου ότι η πραγματική τιμή F > Ftable, η ευρεθείσα εκτίμηση της εξίσωσης παλινδρόμησης είναι στατιστικά αξιόπιστη.

Ερώτηση: Ποια στατιστικά στοιχεία χρησιμοποιούνται για τον έλεγχο της σημασίας ενός μοντέλου παλινδρόμησης;
Απάντηση: Για τη σημασία ολόκληρου του μοντέλου στο σύνολό του, χρησιμοποιούνται στατιστικές F (δοκιμή Fisher).

Η συνάρτηση FISCHER επιστρέφει τον μετασχηματισμό Fisher των ορισμάτων σε X. Αυτός ο μετασχηματισμός παράγει μια συνάρτηση που έχει κανονική και όχι λοξή κατανομή. Η συνάρτηση FISCHER χρησιμοποιείται για τον έλεγχο της υπόθεσης χρησιμοποιώντας τον συντελεστή συσχέτισης.

Περιγραφή της συνάρτησης FISCHER στο Excel

Όταν εργάζεστε με αυτή τη συνάρτηση, πρέπει να ορίσετε την τιμή της μεταβλητής. Αξίζει να σημειωθεί αμέσως ότι υπάρχουν ορισμένες περιπτώσεις στις οποίες αυτή η λειτουργία δεν παράγει αποτελέσματα. Αυτό είναι δυνατό εάν η μεταβλητή:

δεν είναι αριθμός. Σε μια τέτοια περίπτωση, η συνάρτηση FISCHER θα επιστρέψει την τιμή σφάλματος #VALUE!;
έχει τιμή είτε μικρότερη από -1 είτε μεγαλύτερη από 1. Σε αυτήν την περίπτωση, η συνάρτηση FISCHER θα επιστρέψει την τιμή σφάλματος #NUM!.

Η εξίσωση που χρησιμοποιείται για να περιγράψει μαθηματικά τη συνάρτηση FISCHER είναι:

Z"=1/2*ln(1+x)/(1-x)

Ας δούμε τη χρήση αυτής της συνάρτησης χρησιμοποιώντας 3 συγκεκριμένα παραδείγματα.

Εκτίμηση της σχέσης μεταξύ κέρδους και κόστους χρησιμοποιώντας τη συνάρτηση FISHER

Παράδειγμα 1. Χρησιμοποιώντας δεδομένα για τη δραστηριότητα εμπορικών οργανισμών, απαιτείται να γίνει μια αξιολόγηση της σχέσης μεταξύ του κέρδους Y (εκατομμύρια ρούβλια) και του κόστους X (εκατομμύρια ρούβλια) που χρησιμοποιείται για την ανάπτυξη προϊόντων (που φαίνεται στον Πίνακα 1).

Πίνακας 1 – Αρχικά δεδομένα:

№	Χ	Υ
1	210.000.000,00 RUR	95.000.000,00 RUR
2	1.068.000.000,00 RUB	76.000.000,00 RUR
3	1.005.000.000,00 RUB	78.000.000,00 RUR
4	610.000.000,00 RUR	89.000.000,00 RUR
5	768.000.000,00 RUR	77.000.000,00 RUR
6	799.000.000,00 RUB	85.000.000,00 RUR

Το σχέδιο για την επίλυση τέτοιων προβλημάτων έχει ως εξής:

Υπολογίζεται ο συντελεστής γραμμικής συσχέτισης r xy.
Η σημασία του συντελεστή γραμμικής συσχέτισης ελέγχεται με βάση το t-test Student. Σε αυτή την περίπτωση, υποβάλλεται μια υπόθεση και ελέγχεται ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν. Η στατιστική t χρησιμοποιείται για τον έλεγχο αυτής της υπόθεσης. Εάν επιβεβαιωθεί η υπόθεση, η στατιστική t έχει κατανομή Student. Εάν η υπολογισθείσα τιμή t p > t cr, τότε η υπόθεση απορρίπτεται, η οποία υποδηλώνει τη σημασία του συντελεστή γραμμικής συσχέτισης και επομένως τη στατιστική σημασία της σχέσης μεταξύ X και Y.
Προσδιορίζεται μια εκτίμηση διαστήματος για έναν στατιστικά σημαντικό συντελεστή γραμμικής συσχέτισης.
Μια εκτίμηση διαστήματος για τον συντελεστή γραμμικής συσχέτισης προσδιορίζεται με βάση τον αντίστροφο μετασχηματισμό Fisher z.
Υπολογίζεται το τυπικό σφάλμα του συντελεστή γραμμικής συσχέτισης.

Τα αποτελέσματα της επίλυσης αυτού του προβλήματος με τις συναρτήσεις που χρησιμοποιούνται στο Excel φαίνονται στην Εικόνα 1.

Εικόνα 1 – Παράδειγμα υπολογισμών.

Οχι.	Όνομα δείκτη	Τύπος υπολογισμού
1	Συντελεστής συσχέτισης	=CORREL(B2:B7,C2:C7)
2	Υπολογισμένη τιμή t-test tp	=ABS(C8)/SQRT(1-POWER(C8,2))*SQRT(6-2)
3	Τιμή πίνακα t-test trh	=STUDISCOVER(0,05,4)
4	Πίνακας τιμής τυπικής κανονικής κατανομής zy	=NORMSIV((0,95+1)/2)
5	Τιμή μετασχηματισμού Fisher z	=FISHER(C8)
6	Αριστερή εκτίμηση διαστήματος για z	=C12-C11*ROOT(1/(6-3))
7	Δεξιά εκτίμηση διαστήματος για z	=C12+C11*ROOT(1/(6-3))
8	Αριστερή εκτίμηση διαστήματος για rxy	=FISHEROBR(C13)
9	Δεξιά εκτίμηση διαστήματος για rxy	=FISHEROBR(C14)
10	Τυπική απόκλιση για το rxy	=ROOT((1-C8^2)/4)

Έτσι, με πιθανότητα 0,95, ο συντελεστής γραμμικής συσχέτισης βρίσκεται στην περιοχή από (–0,386) έως (–0,990) με τυπικό σφάλμα 0,205.

Έλεγχος της στατιστικής σημασίας της παλινδρόμησης χρησιμοποιώντας τη συνάρτηση FASTER

Παράδειγμα 2. Ελέγξτε τη στατιστική σημασία της εξίσωσης πολλαπλής παλινδρόμησης χρησιμοποιώντας το τεστ F Fisher και εξάγετε συμπεράσματα.

Για να ελέγξουμε τη σημασία της εξίσωσης στο σύνολό της, υποβάλλουμε την υπόθεση H 0 σχετικά με τη στατιστική ασημαντότητα του συντελεστή προσδιορισμού και την αντίθετη υπόθεση H 1 σχετικά με τη στατιστική σημασία του συντελεστή προσδιορισμού:

H 1: R2 ≠ 0.

Ας ελέγξουμε τις υποθέσεις χρησιμοποιώντας το τεστ F του Fisher. Οι δείκτες φαίνονται στον Πίνακα 2.

Πίνακας 2 - Αρχικά δεδομένα

Για να το κάνουμε αυτό, χρησιμοποιούμε τη συνάρτηση στο Excel:

ΠΙΟ ΓΡΗΓΟΡΑ (α;p;n-p-1)

α είναι η πιθανότητα που σχετίζεται με μια δεδομένη κατανομή.
p και n είναι ο αριθμητής και ο παρονομαστής των βαθμών ελευθερίας, αντίστοιχα.

Γνωρίζοντας ότι α = 0,05, p = 2 και n = 53, λαμβάνουμε την ακόλουθη τιμή για το F crit (βλ. Εικόνα 2).

Εικόνα 2 – Παράδειγμα υπολογισμών.

Έτσι μπορούμε να πούμε ότι η F υπολογίστηκε > F κρίσιμη. Ως αποτέλεσμα, η υπόθεση Η 1 για τη στατιστική σημασία του συντελεστή προσδιορισμού γίνεται αποδεκτή.

Υπολογισμός της τιμής του δείκτη συσχέτισης στο Excel

Παράδειγμα 3. Χρήση δεδομένων από 23 επιχειρήσεις σχετικά με: X είναι η τιμή του προϊόντος Α, χιλιάδες ρούβλια. Το Y είναι το κέρδος μιας εμπορικής επιχείρησης, η εξάρτησή τους μελετάται. Το μοντέλο παλινδρόμησης υπολογίστηκε ως εξής: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Ποιος δείκτης συσχέτισης μπορεί να προσδιοριστεί από αυτά τα δεδομένα; Υπολογίστε την τιμή του δείκτη συσχέτισης και, χρησιμοποιώντας το κριτήριο Fisher, βγάλτε ένα συμπέρασμα σχετικά με την ποιότητα του μοντέλου παλινδρόμησης.

Ας προσδιορίσουμε το F crit από την έκφραση:

Υπολογισμός F = R 2 /23*(1-R 2)

όπου R είναι ο συντελεστής προσδιορισμού ίσος με 0,67.

Έτσι, η υπολογιζόμενη τιμή F υπολογίστηκε = 46.

Για να προσδιορίσουμε το F crit χρησιμοποιούμε την κατανομή Fisher (βλ. Εικόνα 3).

Εικόνα 3 – Παράδειγμα υπολογισμών.

Έτσι, η προκύπτουσα εκτίμηση της εξίσωσης παλινδρόμησης είναι αξιόπιστη.