ფიშერის განაწილების კრიტიკული მნიშვნელობა. ფიშერის ზუსტი კრიტერიუმი

ამ მაგალითის გამოყენებით განვიხილავთ, თუ როგორ ფასდება მიღებული რეგრესიის განტოლების სანდოობა. იგივე ტესტი გამოიყენება ჰიპოთეზის შესამოწმებლად, რომ რეგრესიის კოეფიციენტები ერთდროულად ნულის ტოლია, a=0, b=0. სხვა სიტყვებით რომ ვთქვათ, გამოთვლების არსი არის პასუხის გაცემა კითხვაზე: შეიძლება თუ არა მისი გამოყენება შემდგომი ანალიზისა და პროგნოზებისთვის?

იმის დასადგენად, დისპერსიები ორ ნიმუშში მსგავსია თუ განსხვავებული, გამოიყენეთ ეს t-ტესტი.


ამრიგად, ანალიზის მიზანია გარკვეული შეფასების მიღება, რომლითაც შეიძლება ითქვას, რომ α-ს გარკვეულ დონეზე მიღებული რეგრესიის განტოლება სტატისტიკურად სანდოა. Ამისთვის გამოყენებულია განსაზღვრის კოეფიციენტი R 2.
რეგრესიის მოდელის მნიშვნელოვნების ტესტირება ხორციელდება ფიშერის F ტესტის გამოყენებით, რომლის გამოთვლილი მნიშვნელობა გვხვდება შესწავლილი ინდიკატორის დაკვირვებების თავდაპირველი სერიის დისპერსიის თანაფარდობით და ნარჩენი თანმიმდევრობის დისპერსიის მიუკერძოებელი შეფასება. ამ მოდელისთვის.
თუ გამოთვლილი მნიშვნელობა k 1 =(m) და k 2 =(n-m-1) თავისუფლების ხარისხით აღემატება ცხრილის მნიშვნელობას მოცემულ მნიშვნელოვნების დონეზე, მაშინ მოდელი ითვლება მნიშვნელოვანად.

სადაც m არის მოდელის ფაქტორების რაოდენობა.
დაწყვილებული წრფივი რეგრესიის სტატისტიკური მნიშვნელოვნება ფასდება შემდეგი ალგორითმის გამოყენებით:
1. წამოიჭრება ნულოვანი ჰიპოთეზა, რომ განტოლება მთლიანობაში სტატისტიკურად უმნიშვნელოა: H 0: R 2 =0 მნიშვნელოვნების დონეზე α.
2. შემდეგ განსაზღვრეთ F-კრიტერიუმის რეალური მნიშვნელობა:


სადაც m=1 წყვილთა რეგრესია.
3. ცხრილის მნიშვნელობა განისაზღვრება ფიშერის განაწილების ცხრილებიდან მოცემული მნიშვნელოვნების დონისთვის, იმის გათვალისწინებით, რომ კვადრატების ჯამური ჯამისთვის თავისუფლების გრადუსების რაოდენობა (უფრო დიდი ვარიაცია) არის 1, ხოლო თავისუფლების გრადუსების რაოდენობა ნარჩენისთვის. წრფივი რეგრესიაში კვადრატების ჯამი (მცირე დისპერსია) არის n-2 (ან Excel ფუნქციის FRIST(ალბათობა,1,n-2) მეშვეობით.
F ცხრილი არის კრიტერიუმის მაქსიმალური შესაძლო მნიშვნელობა შემთხვევითი ფაქტორების გავლენის ქვეშ, მოცემული თავისუფლების ხარისხითა და მნიშვნელოვნების α დონით. მნიშვნელოვნების დონე α არის სწორი ჰიპოთეზის უარყოფის ალბათობა, იმ პირობით, რომ ის მართალია. როგორც წესი, α მიიღება 0,05 ან 0,01.
4. თუ F-ტესტის რეალური მნიშვნელობა ცხრილის მნიშვნელობაზე ნაკლებია, მაშინ ამბობენ, რომ ნულოვანი ჰიპოთეზის უარყოფის საფუძველი არ არსებობს.
წინააღმდეგ შემთხვევაში, ნულოვანი ჰიპოთეზა უარყოფილია და ალტერნატიული ჰიპოთეზა მთლიანობაში განტოლების სტატისტიკური მნიშვნელობის შესახებ მიიღება ალბათობით (1-α).
კრიტერიუმის ცხრილის მნიშვნელობა თავისუფლების ხარისხით k 1 =1 და k 2 =48, F ცხრილი = 4

დასკვნები: ვინაიდან ფაქტობრივი მნიშვნელობა F > F ცხრილი, განსაზღვრის კოეფიციენტი არის სტატისტიკურად მნიშვნელოვანი ( ნაპოვნი რეგრესიის განტოლების შეფასება სტატისტიკურად სანდოა) .

დისპერსიის ანალიზი

.

რეგრესიის განტოლების ხარისხის ინდიკატორები

მაგალითი. სულ 25 სავაჭრო საწარმოზე დაყრდნობით, შესწავლილია კავშირი შემდეგ მახასიათებლებს შორის: X - პროდუქტის ფასი A, ათასი რუბლი; Y არის სავაჭრო საწარმოს მოგება, მილიონი რუბლი. რეგრესიული მოდელის შეფასებისას მიღებული იქნა შემდეგი შუალედური შედეგები: ∑(y i -y x) 2 = 46000; ∑(y i -y საშუალო) 2 = 138000. რა კორელაციური ინდიკატორი შეიძლება განისაზღვროს ამ მონაცემებიდან? გამოთვალეთ ამ ინდიკატორის მნიშვნელობა ამ შედეგის საფუძველზე და გამოყენებით ფიშერის F ტესტიგამოიტანეთ დასკვნები რეგრესიის მოდელის ხარისხზე.
გამოსავალი. ამ მონაცემებიდან შეგვიძლია განვსაზღვროთ ემპირიული კორელაციის თანაფარდობა: , სადაც ∑(y საშუალო -y x) 2 = ∑(y i -y საშუალო) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92,000.
η 2 = 92,000/138000 = 0,67, η = 0,816 (0,7< η < 0.9 - связь между X и Y высокая).

ფიშერის F ტესტი: n = 25, m = 1.
R 2 = 1 - 46000/138000 = 0.67, F = 0.67/(1-0.67)x(25 - 1 - 1) = 46. F ცხრილი (1; 23) = 4.27
ვინაიდან რეალური მნიშვნელობა F > Ftable, რეგრესიის განტოლების ნაპოვნი შეფასება სტატისტიკურად სანდოა.

კითხვა: რა სტატისტიკა გამოიყენება რეგრესიის მოდელის მნიშვნელოვნების შესამოწმებლად?
პასუხი: მთლიანი მოდელის მნიშვნელოვნებისთვის გამოიყენება F- სტატისტიკა (ფიშერის ტესტი).

მიზანი.ჰიპოთეზის ტესტირება, რომ ორი ვარიაცია ეკუთვნის ერთსა და იმავე ზოგად პოპულაციას და, შესაბამისად, მათი თანასწორობა.

Ნულოვანი ჰიპოთეზა. S 2 2 = S 1 2

ალტერნატიული ჰიპოთეზა. N A-სთვის არის შემდეგი ვარიანტები, იმისდა მიხედვით, თუ რომელი კრიტიკული ზონები განსხვავდება:

1. S 1 2 > S 2 2 . ყველაზე ხშირად გამოყენებული ვარიანტია H A. კრიტიკული რეგიონია F- განაწილების ზედა კუდი.

2. S 1 2< S 2 2 . Критическая область - нижний хвост F-распределения. Ввиду частого отсутствия нижнего хвоста, в таблицах критическую область обычно сводят к варианту 1, меняя местами дисперсии.

3. ორმხრივი S 1 2 ≠S 2 2. პირველი ორის კომბინაცია.

წინაპირობები.მონაცემები დამოუკიდებელია და ნორმალურად ნაწილდება. ჰიპოთეზა, რომ ორი ნორმალური პოპულაციის დისპერსიები ტოლია, მიიღება, თუ უფრო დიდისა და პატარა ვარიაციის თანაფარდობა ნაკლებია ფიშერის განაწილების კრიტიკულ მნიშვნელობაზე.

F P = S 1 2 /S 2 2

Შენიშვნა. აღწერილი გადამოწმების მეთოდით, Fpasch-ის მნიშვნელობა აუცილებლად უნდა იყოს ერთზე მეტი. კრიტერიუმი მგრძნობიარეა ნორმალურობის დაშვების დარღვევის მიმართ.

ორმხრივი ალტერნატივისთვის S 1 2 ≠S 2 2 ნულოვანი ჰიპოთეზა მიიღება, თუ პირობა დაკმაყოფილებულია:

F l - α /2< Fрасч < F α /2

მაგალითი

თერმოფიზიკური პარამეტრები განისაზღვრა რთული თერმომეტრიული მეთოდით. მწვანე ალაოს მახასიათებლები (TFC). ნიმუშების მოსამზადებლად ავიღეთ ჰაერში (საშუალო ტენიანობა W=19%) და სველი ოთხდღიანი დაძველების ალაო (W=45%) კარამელის ალაოს მომზადების ახალი ტექნოლოგიის შესაბამისად. ექსპერიმენტებმა აჩვენა, რომ სველი ალაოს თბოგამტარობა λ დაახლოებით 2,5-ჯერ აღემატება მშრალ ალაოს და მოცულობითი სითბოს სიმძლავრე არ არის მკაფიო დამოკიდებული ალაოს ტენიანობაზე. ამიტომ, F-ტესტის გამოყენებით, ჩვენ შევამოწმეთ მონაცემების განზოგადების შესაძლებლობა საშუალო მნიშვნელობებზე დაყრდნობით, ტენიანობის გათვალისწინების გარეშე.

გამოთვლილი მონაცემები შეჯამებულია ცხრილში 5.1

ცხრილი 5.1

F- კრიტერიუმის გამოთვლის მონაცემები

უფრო დიდი დისპერსიული მნიშვნელობა იქნა მიღებული W=45%, ე.ი. S 2 45 = S 1 2, S 2 19 = S 2 2 და F P = S 1 2 / S 2 2 = 1.35. ცხრილიდან 5.2 თავისუფლების ხარისხისთვის f 1 =N 1 -1=5 f 2 =N 2 -1=4 γ=0.95-ზე ვადგენთ F KR =6.2. ნულოვანი ჰიპოთეზა ჩამოყალიბებულია როგორც „მწვანე ალაოს ტენიანობის 19-დან 45%-მდე დიაპაზონში, მისი გავლენა მოცულობითი სითბოს სიმძლავრეზე შეიძლება უგულებელყო“ ან „S 2 45 = S 2 19“, 95% ნდობის ალბათობით. დადასტურებულია, რადგან Fp

ჰიპოთეზის ტესტირების მაგალითი ორი ვარიაციის ერთსა და იმავე პოპულაციაზე კუთვნილების შესახებ ფიშერის კრიტერიუმის გამოყენებით Excel-ის გამოყენებით

მონაცემები წარმოდგენილია ხორბლის მარცვლის წყლის შთანთქმის ხარისხის ორ დამოუკიდებელ ნიმუშზე (ცხრილი 5.2) ჩატარდა დაბალი სიხშირის მაგნიტური ველების ზემოქმედების კვლევა.

ცხრილი 5.2

კვლევის შედეგები

ნომერი ნიმუშის ნომერი
გამოცდილება 2 ,
0,027 0,075
0,036 0,4
0,1 0,08
0,12 0,105
0,32 0,075
0,45 0,12
0,049 0,06
0,105 0,075

სანამ ამ ნიმუშების საშუალებების თანასწორობის ჰიპოთეზას შევამოწმებთ, საჭიროა შევამოწმოთ ჰიპოთეზა დისპერსიების ტოლობის შესახებ, რათა ვიცოდეთ რომელი კრიტერიუმი ავირჩიოთ მის შესამოწმებლად.

ნახ. 5.1 გვიჩვენებს ჰიპოთეზის ტესტირების მაგალითს, რომ ორი ვარიაცია ეკუთვნის ერთსა და იმავე პოპულაციას ფიშერის კრიტერიუმის გამოყენებით Microsoft Excel პროგრამული პროდუქტის გამოყენებით.

სურათი 5.1 ფიშერის კრიტერიუმის გამოყენებით ორი ვარიაციების ერთ პოპულაციაზე კუთვნილების ტესტირების მაგალითი

წყაროს მონაცემები განთავსებულია უჯრედებში, რომლებიც მდებარეობს C და D სვეტების კვეთაზე 3-10 სტრიქონებით. მოდით გავაკეთოთ შემდეგი:

1. განვსაზღვროთ, შეიძლება ჩაითვალოს თუ არა პირველი და მეორე ნიმუშების განაწილების კანონი ნორმალურად (სვეტები C და D, შესაბამისად). თუ არა (ერთ ნიმუშზე მაინც), მაშინ აუცილებელია არაპარამეტრული ტესტის გამოყენება, თუ კი, ვაგრძელებთ.

2. გამოთვალეთ ვარიაციები პირველი და მეორე სვეტებისთვის. ამისათვის SP და D11 უჯრედებში ვათავსებთ შესაბამისად =DISP(SZ:C10) და =DISP(DЗ:D10) ფუნქციებს. ამ ფუნქციების შედეგი არის გამოთვლილი დისპერსიის მნიშვნელობა თითოეული სვეტისთვის, შესაბამისად.

3. იპოვეთ ფიშერის კრიტერიუმის გამოთვლილი მნიშვნელობა. ამისათვის საჭიროა უფრო დიდი დისპერსიის გაყოფა პატარაზე. F13 უჯრედში ვათავსებთ ფორმულას =C11/D11, რომელიც ასრულებს ამ ოპერაციას.

4. დაადგინეთ შეიძლება თუ არა მიღებული დისპერსიების თანასწორობის ჰიპოთეზა. არსებობს ორი მეთოდი, რომლებიც წარმოდგენილია მაგალითში. პირველი მეთოდის მიხედვით, მნიშვნელოვნების დონის დაყენებით, მაგალითად 0.05, გამოითვლება ფიშერის განაწილების კრიტიკული მნიშვნელობა ამ სიდიდეზე და თავისუფლების გრადუსების შესაბამისი რაოდენობა. F14 უჯრედში შეიყვანეთ ფუნქცია =FPACPOBP(0.05;7;7) (სადაც 0.05 არის მითითებული მნიშვნელოვნების დონე; 7 არის მრიცხველის თავისუფლების ხარისხი და 7 (მეორე) არის თავისუფლების გრადუსების რაოდენობა. მნიშვნელი). თავისუფლების გრადუსების რაოდენობა უდრის ექსპერიმენტების რაოდენობას მინუს ერთი. შედეგი არის 3.787051. ვინაიდან ეს მნიშვნელობა აღემატება 1.81144 გამოთვლილ მნიშვნელობას, ჩვენ უნდა მივიღოთ დისპერსიების ტოლობის ნულოვანი ჰიპოთეზა.

მეორე ვარიანტის მიხედვით გამოითვლება შესაბამისი ალბათობა ფიშერის კრიტერიუმის მიღებულ გამოთვლილ მნიშვნელობაზე. ამისათვის შეიყვანეთ ფუნქცია =FPACP(F13,7,7) F15 უჯრედში. ვინაიდან მიღებული მნიშვნელობა 0,22566 არის 0,05-ზე მეტი, მიღებულია ვარიაციების თანასწორობის ჰიპოთეზა.

ეს შეიძლება გაკეთდეს სპეციალური ფუნქციით. აირჩიეთ მენიუს ელემენტები თანმიმდევრობით სერვისი , Მონაცემთა ანალიზი . გამოჩნდება შემდეგი ფანჯარა (ნახ. 5.2).

სურათი 5.2 დამუშავების მეთოდის შერჩევის ფანჯარა

ამ ფანჯარაში აირჩიეთ " ორი ნიმუში F-mecm დისპერსიებისთვის " შედეგად, გამოჩნდება ფანჯარა, როგორც ნაჩვენებია ნახ. 5.3. აქ აყენებთ პირველი და მეორე ცვლადის ინტერვალებს (უჯრედების ნომრებს), მნიშვნელოვნების დონეს (ალფა) და ადგილს, სადაც იქნება შედეგი.

დააყენეთ ყველა საჭირო პარამეტრი და დააჭირეთ OK. სამუშაოს შედეგი ნაჩვენებია ნახ. 5.4

უნდა აღინიშნოს, რომ ფუნქცია ცალმხრივ კრიტერიუმს ამოწმებს და ამას სწორად აკეთებს. იმ შემთხვევისთვის, როდესაც კრიტერიუმის მნიშვნელობა 1-ზე მეტია, გამოითვლება ზედა კრიტიკული მნიშვნელობა.

სურათი 5.3 პარამეტრის დაყენების ფანჯარა

როდესაც კრიტერიუმის მნიშვნელობა 1-ზე ნაკლებია, გამოითვლება ქვედა კრიტიკული მნიშვნელობა.

შეგახსენებთ, რომ ვარიაციების თანასწორობის ჰიპოთეზა უარყოფილია, თუ კრიტერიუმის მნიშვნელობა აღემატება ზედა კრიტიკულ მნიშვნელობას ან ნაკლებია ქვედაზე.

დიაგრამა 5.4 დისპერსიების ტოლობის ტესტირება

FISCHER ფუნქცია აბრუნებს არგუმენტების ფიშერის ტრანსფორმაციას X-ზე. ეს ტრანსფორმაცია აწარმოებს ფუნქციას, რომელსაც აქვს ნორმალური და არა დახრილი განაწილება. FISCHER ფუნქცია გამოიყენება ჰიპოთეზის შესამოწმებლად კორელაციის კოეფიციენტის გამოყენებით.

FISCHER ფუნქციის აღწერა Excel-ში

ამ ფუნქციასთან მუშაობისას უნდა დააყენოთ ცვლადის მნიშვნელობა. დაუყოვნებლივ უნდა აღინიშნოს, რომ არის სიტუაციები, როდესაც ეს ფუნქცია არ გამოიღებს შედეგს. ეს შესაძლებელია, თუ ცვლადი:

  • არ არის რიცხვი. ასეთ სიტუაციაში FISCHER ფუნქცია დააბრუნებს შეცდომის მნიშვნელობას #VALUE!;
  • აქვს მნიშვნელობა ან -1-ზე ნაკლები ან 1-ზე მეტი. ამ შემთხვევაში, FISCHER ფუნქცია დააბრუნებს შეცდომის მნიშვნელობას #NUM!.

განტოლება, რომელიც გამოიყენება FISCHER ფუნქციის მათემატიკურად აღსაწერად არის:

Z"=1/2*ln(1+x)/(1-x)

მოდით შევხედოთ ამ ფუნქციის გამოყენებას 3 კონკრეტული მაგალითის გამოყენებით.



მოგებასა და ხარჯებს შორის კავშირის შეფასება FISHER ფუნქციის გამოყენებით

მაგალითი 1. კომერციული ორგანიზაციების საქმიანობის შესახებ მონაცემების გამოყენებით, საჭიროა შეაფასოთ კავშირი მოგებას Y (მილიონი რუბლი) და X (მილიონი რუბლი) დანახარჯებს შორის, რომლებიც გამოიყენება პროდუქტის განვითარებისთვის (ნაჩვენებია ცხრილში 1).

ცხრილი 1 – საწყისი მონაცემები:

X
1 210,000,000.00 რუბლი95,000,000.00 რუბლი
2 1,068,000,000.00 რუბლი76,000,000.00 რუბლი
3 1,005,000,000.00 რუბლი78,000,000.00 რუბლი
4 610,000,000.00 რუბლი89,000,000.00 რუბლი
5 768,000,000.00 რუბლი77,000,000.00 რუბლი
6 799,000,000.00 რუბლი85,000,000.00 რუბლი

ასეთი პრობლემების გადაჭრის სქემა შემდეგია:

  1. გამოითვლება წრფივი კორელაციის კოეფიციენტი r xy;
  2. წრფივი კორელაციის კოეფიციენტის მნიშვნელოვნება მოწმდება Student-ის t-ტესტის საფუძველზე. ამ შემთხვევაში წამოიჭრება და შემოწმებულია ჰიპოთეზა, რომ კორელაციის კოეფიციენტი ნულის ტოლია. t- სტატისტიკა გამოიყენება ამ ჰიპოთეზის შესამოწმებლად. თუ ჰიპოთეზა დადასტურდა, t-სტატისტიკას აქვს Student განაწილება. თუ გამოთვლილი მნიშვნელობა t p > t cr, მაშინ უარყოფილია ჰიპოთეზა, რომელიც მიუთითებს წრფივი კორელაციის კოეფიციენტის მნიშვნელობაზე და, შესაბამისად, X და Y შორის ურთიერთობის სტატისტიკურ მნიშვნელობაზე;
  3. ინტერვალის შეფასება განისაზღვრება სტატისტიკურად მნიშვნელოვანი წრფივი კორელაციის კოეფიციენტისთვის.
  4. წრფივი კორელაციის კოეფიციენტის ინტერვალის შეფასება განისაზღვრება ინვერსიული ფიშერის z-ტრანსფორმის საფუძველზე;
  5. გამოითვლება წრფივი კორელაციის კოეფიციენტის სტანდარტული შეცდომა.

Excel-ში გამოყენებული ფუნქციებით ამ პრობლემის გადაჭრის შედეგები ნაჩვენებია სურათზე 1.


სურათი 1 - გამოთვლების მაგალითი.

არა.ინდიკატორის სახელიგაანგარიშების ფორმულა
1 Კორელაციის კოეფიციენტი=CORREL(B2:B7,C2:C7)
2 გამოთვლილი t-ტესტის მნიშვნელობა tp=ABS(C8)/SQRT(1-POWER(C8,2))*SQRT(6-2)
3 t-test trh-ის ცხრილის მნიშვნელობა=STUDISCOVER(0.05,4)
4 სტანდარტული ნორმალური განაწილების ცხრილის მნიშვნელობა zy=NORMSINV((0.95+1)/2)
5 Fisher z-ის გარდაქმნის მნიშვნელობა=FISHER(C8)
6 მარცხენა ინტერვალის შეფასება z=C12-C11*ROOT(1/(6-3))
7 მარჯვენა ინტერვალის შეფასება z=C12+C11*ROOT(1/(6-3))
8 მარცხენა ინტერვალის შეფასება rxy-სთვის=FISHEROBR(C13)
9 სწორი ინტერვალის შეფასება rxy-სთვის=FISHEROBR(C14)
10 სტანდარტული გადახრა rxy-სთვის=ROOT((1-C8^2)/4)

ამრიგად, 0,95 ალბათობით, წრფივი კორელაციის კოეფიციენტი დევს დიაპაზონში (–0,386)–დან (–0,990–მდე), სტანდარტული შეცდომით 0,205.

რეგრესიის სტატისტიკური მნიშვნელობის შემოწმება FASTER ფუნქციის გამოყენებით

მაგალითი 2. შეამოწმეთ მრავალჯერადი რეგრესიის განტოლების სტატისტიკური მნიშვნელობა ფიშერის F ტესტის გამოყენებით და გამოიტანეთ დასკვნები.

განტოლების მთლიანობაში მნიშვნელოვნების შესამოწმებლად, ჩვენ წამოვაყენეთ ჰიპოთეზა H 0 განსაზღვრის კოეფიციენტის სტატისტიკური უმნიშვნელოობის შესახებ და საპირისპირო ჰიპოთეზა H 1 განსაზღვრის კოეფიციენტის სტატისტიკური მნიშვნელობის შესახებ:

H 1: R 2 ≠ 0.

მოდით შევამოწმოთ ჰიპოთეზები ფიშერის F ტესტის გამოყენებით. ინდიკატორები ნაჩვენებია ცხრილში 2.

ცხრილი 2 - საწყისი მონაცემები

ამისათვის ჩვენ ვიყენებთ ფუნქციას Excel-ში:

უფრო სწრაფად (α;p;n-p-1)

  • α არის მოცემულ განაწილებასთან დაკავშირებული ალბათობა;
  • p და n არის თავისუფლების ხარისხების მრიცხველი და მნიშვნელი, შესაბამისად.

იმის ცოდნა, რომ α = 0.05, p = 2 და n = 53, ჩვენ ვიღებთ შემდეგ მნიშვნელობას F კრიტისთვის (იხ. სურათი 2).


სურათი 2 - გამოთვლების მაგალითი.

ამრიგად, შეგვიძლია ვთქვათ, რომ F გამოითვლება > F კრიტიკული. შედეგად მიღებულია ჰიპოთეზა H 1 განსაზღვრის კოეფიციენტის სტატისტიკური მნიშვნელობის შესახებ.

კორელაციის ინდიკატორის მნიშვნელობის გამოთვლა Excel-ში

მაგალითი 3. 23 საწარმოს მონაცემების გამოყენებით: X არის A პროდუქტის ფასი, ათასი რუბლი; Y არის სავაჭრო საწარმოს მოგება, მიმდინარეობს მათი დამოკიდებულების შესწავლა. რეგრესიის მოდელი შეფასდა შემდეგნაირად: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. რა კორელაციური ინდიკატორი შეიძლება განისაზღვროს ამ მონაცემებიდან? გამოთვალეთ კორელაციის ინდიკატორის მნიშვნელობა და ფიშერის კრიტერიუმის გამოყენებით გამოიტანეთ დასკვნა რეგრესიული მოდელის ხარისხის შესახებ.

მოდით განვსაზღვროთ F კრიტი გამონათქვამიდან:

F გამოითვლება = R 2 /23*(1-R 2)

სადაც R არის განსაზღვრის კოეფიციენტი ტოლი 0,67.

ამრიგად, გამოთვლილი მნიშვნელობა F calc = 46.

F კრიტის დასადგენად ვიყენებთ ფიშერის განაწილებას (იხ. სურათი 3).


სურათი 3 - გამოთვლების მაგალითი.

ამრიგად, რეგრესიის განტოლების შედეგად მიღებული შეფასება საიმედოა.

ფიშერის ზუსტი ტესტი არის კრიტერიუმი, რომელიც გამოიყენება ორი შედარებითი ინდიკატორის შესადარებლად, რომლებიც ახასიათებენ კონკრეტული მახასიათებლის სიხშირეს, რომელსაც აქვს ორი მნიშვნელობა. ფიშერის ზუსტი ტესტის გამოსათვლელად თავდაპირველი მონაცემები, როგორც წესი, ჯგუფდება ოთხი ველის ცხრილის სახით.

1. კრიტერიუმის განვითარების ისტორია

კრიტერიუმი პირველად იქნა შემოთავაზებული რონალდ ფიშერითავის წიგნში ექსპერიმენტების დიზაინი. ეს მოხდა 1935 წელს. თავად ფიშერი ამტკიცებდა, რომ მურიელ ბრისტოლმა მას ამ იდეისკენ უბიძგა. 1920-იანი წლების დასაწყისში, რონალდი, მურიელი და უილიამ როუჩი განლაგდნენ ინგლისში სოფლის მეურნეობის ექსპერიმენტულ სადგურზე. მურიელი ამტკიცებდა, რომ მას შეეძლო დაედგინა თასში ჩაის და რძის ჩასხმის თანმიმდევრობა. იმ დროს მისი განცხადების სისწორის გადამოწმება ვერ მოხერხდა.

ამან წარმოშვა ფიშერის იდეა "ნულის ჰიპოთეზის" შესახებ. მიზანი არ იყო იმის დამტკიცება, რომ მურიელს შეეძლო გაერჩია განსხვავებულად მომზადებული ჩაის ფინჯნები. გადაწყდა, რომ უარყოთ ჰიპოთეზა, რომ ქალი არჩევანს შემთხვევით აკეთებს. დადგინდა, რომ ნულოვანი ჰიპოთეზა ვერც დადასტურდა და ვერც გამართლდა. მაგრამ მისი უარყოფა შესაძლებელია ექსპერიმენტების დროს.

მომზადდა 8 ჭიქა. პირველი ოთხი ჯერ რძით ივსება, დანარჩენი ოთხი ჩაით. ჭიქები აირია. ბრისტოლმა შესთავაზა ჩაის გასინჯვა და ჭიქების დაყოფა ჩაის მომზადების მეთოდის მიხედვით. შედეგი ორი ჯგუფი უნდა ყოფილიყო. ისტორია ამბობს, რომ ექსპერიმენტი წარმატებული იყო.

ფიშერის ტესტის წყალობით, ბრისტოლის ინტუიციურად მოქმედების ალბათობა შემცირდა 0,01428-მდე. ანუ 70-დან ერთ შემთხვევაში იყო შესაძლებელი თასის სწორად ამოცნობა. მაგრამ მაინც არ შეიძლება ნულამდე დავაკლოთ ის შანსები, რომლებსაც მადამ შემთხვევით განსაზღვრავს. თუნდაც გაზარდოთ ჭიქების რაოდენობა.

ამ ამბავმა ბიძგი მისცა "ნულის ჰიპოთეზის" განვითარებას. ამავდროულად, შემოთავაზებული იქნა ფიშერის ზუსტი კრიტერიუმი, რომლის არსი არის დამოკიდებული და დამოუკიდებელი ცვლადების ყველა შესაძლო კომბინაციის ჩამოთვლა.

2. რისთვის გამოიყენება ფიშერის ზუსტი ტესტი?

შედარებისთვის ძირითადად გამოიყენება ფიშერის ზუსტი ტესტი მცირე ნიმუშები. ამის ორი კარგი მიზეზი არსებობს. პირველ რიგში, კრიტერიუმის გაანგარიშება საკმაოდ რთულია და შეიძლება დიდი დრო დასჭირდეს ან მოითხოვოს ძლიერი გამოთვლითი რესურსები. მეორეც, კრიტერიუმი საკმაოდ ზუსტია (რაც მის სახელშიც კი აისახება), რაც საშუალებას იძლევა გამოიყენოს ის კვლევებში მცირე რაოდენობის დაკვირვებით.

განსაკუთრებული ადგილი ეთმობა ფიშერის ზუსტ ტესტს მედიცინაში. ეს არის მნიშვნელოვანი მეთოდი სამედიცინო მონაცემების დასამუშავებლად და იპოვა მისი გამოყენება მრავალ სამეცნიერო კვლევაში. მისი წყალობით შესაძლებელია გარკვეული ფაქტორებისა და შედეგების ურთიერთკავშირის შესწავლა, პათოლოგიური მდგომარეობის სიხშირის შედარება სუბიექტთა ორ ჯგუფს შორის და ა.შ.

3. რა შემთხვევაში შეიძლება გამოვიყენოთ ფიშერის ზუსტი ტესტი?

  1. შედარებული ცვლადები უნდა გაიზომოს ნომინალური მასშტაბიდა აქვს მხოლოდ ორი მნიშვნელობამაგალითად, არტერიული წნევა ნორმალურია ან მომატებული, შედეგი არის ხელსაყრელი ან არასახარბიელო, არის პოსტოპერაციული გართულებები თუ არა.
  2. ფიშერის ზუსტი ტესტი შედარებისთვისაა განკუთვნილი ორი დამოუკიდებელი ჯგუფი, გაყოფილი ფაქტორების მიხედვით. შესაბამისად, ფაქტორსაც უნდა ჰქონდეს მხოლოდ ორი შესაძლო მნიშვნელობა.
  3. ტესტი შესაფერისია ძალიან მცირე ნიმუშების შესადარებლად: ფიშერის ზუსტი ტესტი შეიძლება გამოყენებულ იქნას ოთხნაწილიანი ცხრილების გასაანალიზებლად მოსალოდნელი ფენომენის 5-ზე ნაკლები მნიშვნელობების შემთხვევაში, რაც შეზღუდვაა პირსონის ჩი-კვადრატის გამოყენებისთვის. ტესტი, თუნდაც Yates-ის შესწორების გათვალისწინებით.
  4. ფიშერის ზუსტი ტესტი შეიძლება იყოს ცალმხრივი და ორმხრივი. ცალმხრივი ვარიანტით, ზუსტად არის ცნობილი, სად გადაიხრება ერთ-ერთი მაჩვენებელი. მაგალითად, კვლევა ადარებს რამდენი პაციენტი გამოჯანმრთელდა საკონტროლო ჯგუფთან შედარებით. ვარაუდობენ, რომ თერაპია არ შეიძლება გააუარესოს პაციენტების მდგომარეობას, არამედ მხოლოდ განკურნება ან არა.
    ორმხრივი ტესტი აფასებს სიხშირის განსხვავებებს ორი მიმართულებით. ანუ ფასდება ფენომენის როგორც უფრო მაღალი, ისე დაბალი სიხშირის ალბათობა ექსპერიმენტულ ჯგუფში საკონტროლო ჯგუფთან შედარებით.

ფიშერის ზუსტი ტესტის ანალოგი არის Pearson chi-square ტესტი, ხოლო ფიშერის ზუსტ ტესტს უფრო მაღალი სიმძლავრე აქვს, განსაკუთრებით მცირე ნიმუშების შედარებისას და ამიტომ აქვს უპირატესობა ამ შემთხვევაში.

4. როგორ გამოვთვალოთ ფიშერის ზუსტი ტესტი?

ვთქვათ, ჩვენ ვსწავლობთ თანდაყოლილი მანკით დაავადებული ბავშვების დაბადების სიხშირის დამოკიდებულებას ორსულობის დროს დედის მოწევაზე. ამისთვის შეირჩა ორსულთა ორი ჯგუფი, რომელთაგან ერთი იყო ექსპერიმენტული ჯგუფი, რომელიც შედგებოდა 80 ქალისგან, რომლებიც ეწეოდნენ ორსულობის პირველ ტრიმესტრში, ხოლო მეორე იყო შედარების ჯგუფი, მათ შორის 90 ქალი, რომელიც მთელი ორსულობის განმავლობაში ჯანსაღი ცხოვრების წესს უტარებდა. ექსპერიმენტულ ჯგუფში ულტრაბგერითი მონაცემებით განსაზღვრული ნაყოფის თანდაყოლილი მანკის შემთხვევების რაოდენობა იყო 10, შედარების ჯგუფში - 2.

ჯერ ვწერთ ოთხველიანი საგანგებო ცხრილი:

ფიშერის ზუსტი ტესტი გამოითვლება შემდეგი ფორმულით:

სადაც N არის საგნების საერთო რაოდენობა ორ ჯგუფში; ! - ფაქტორიალი, რომელიც არის რიცხვისა და რიცხვების მიმდევრობის ნამრავლი, რომელთაგან თითოეული წინაზე ნაკლებია 1-ით (მაგალითად, 4! = 4 3 2 1)

გამოთვლების შედეგად ვხვდებით, რომ P = 0.0137.

5. როგორ განვსაზღვროთ ფიშერის ზუსტი ტესტის მნიშვნელობა?

მეთოდის უპირატესობა ის არის, რომ მიღებული კრიტერიუმი შეესაბამება მნიშვნელოვნების დონის ზუსტ მნიშვნელობას გვ. ანუ ჩვენს მაგალითში მიღებული მნიშვნელობა 0,0137 არის ნაყოფის თანდაყოლილი მანკების განვითარების სიხშირეში შედარებულ ჯგუფებს შორის განსხვავებების მნიშვნელობის დონე. საჭიროა მხოლოდ ამ რიცხვის შედარება მნიშვნელოვნების კრიტიკულ დონესთან, რომელიც ჩვეულებრივ სამედიცინო კვლევებში 0,05-ია.

  • თუ ფიშერის ზუსტი ტესტის მნიშვნელობა კრიტიკულ მნიშვნელობაზე მეტია, ის მიიღება ნულოვანი ჰიპოთეზადა დასკვნა, რომ არ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები შედეგის სიხშირეში, რაც დამოკიდებულია რისკის ფაქტორის არსებობაზე.
  • თუ ფიშერის ზუსტი ტესტის მნიშვნელობა კრიტიკულზე ნაკლებია, ის მიიღება ალტერნატიული ჰიპოთეზადა დასკვნა, რომ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები შედეგის სიხშირეში, რაც დამოკიდებულია რისკის ფაქტორზე ზემოქმედებაზე.

ჩვენს მაგალითში პ< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин სტატისტიკურად მნიშვნელოვნად მაღალიავიდრე არამწეველები.

აბრუნებს (მარჯვნივ) F ალბათობის განაწილების ინვერსიას. თუ p = FRIST(x;...), მაშინ FRIST(p;...) = x.

F განაწილება შეიძლება გამოყენებულ იქნას F ტესტში, რომელიც ადარებს მონაცემთა ორი ნაკრების დისპერსიის ხარისხს. მაგალითად, თქვენ შეგიძლიათ გააანალიზოთ შეერთებული შტატებისა და კანადის შემოსავლების განაწილება, რათა დაადგინოთ მსგავსია თუ არა ეს ორი ქვეყანა შემოსავლის სიმკვრივის თვალსაზრისით.

Მნიშვნელოვანი:ეს ფუნქცია შეიცვალა ერთი ან მეტი ახალი ფუნქციით, რომელიც უზრუნველყოფს უფრო დიდ სიზუსტეს და აქვს სახელები, რომლებიც უკეთ ასახავს მათ მიზანს. მიუხედავად იმისა, რომ ეს ფუნქცია კვლავ გამოიყენება უკანა თავსებადობისთვის, ის შესაძლოა აღარ იყოს ხელმისაწვდომი Excel-ის მომავალ ვერსიებში, ამიტომ გირჩევთ გამოიყენოთ ახალი ფუნქციები.

ახალი ფუნქციების შესახებ მეტი ინფორმაციისთვის იხილეთ სტატიები F.REV Function და F.REV.PH Function.

Სინტაქსი

FRIST(ალბათობა,თავისუფლების_ხარისხი1,თავისუფლების_ხარისხი2)

FALTER ფუნქციის არგუმენტები აღწერილია ქვემოთ.

    ალბათობა- საჭირო არგუმენტი. ალბათობა, რომელიც დაკავშირებულია კუმულატიურ F განაწილებასთან.

    თავისუფლების_ხარისხები1- საჭირო არგუმენტი. თავისუფლების ხარისხების მრიცხველი.

    თავისუფლების_ხარისხები2- საჭირო არგუმენტი. თავისუფლების ხარისხების მნიშვნელი.

შენიშვნები

    თუ რომელიმე არგუმენტი არ არის რიცხვი, FRATE აბრუნებს შეცდომის მნიშვნელობას #VALUE!

    თუ "ალბათობა"< 0 или "вероятность" >1, ფუნქცია FRIST აბრუნებს შეცდომის მნიშვნელობას #NUM!.

    თუ გრადუსების_თავისუფლების1 ან გრადუსების_თავისუფლების2 მნიშვნელობა არ არის მთელი რიცხვი, ის იკვეთება.

    თუ "თავისუფლების_ხარისხი1"< 1 или "степени_свободы1" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

    თუ "თავისუფლების_ხარისხი2"< 1 или "степени_свободы2" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

FDIST ფუნქცია შეიძლება გამოყენებულ იქნას F განაწილების კრიტიკული მნიშვნელობების დასადგენად. მაგალითად, ANOVA შედეგები, როგორც წესი, მოიცავს მონაცემებს F სტატისტიკისთვის, F ალბათობისა და F განაწილების კრიტიკულ მნიშვნელობას მნიშვნელოვნების დონეზე 0.05. F-ის კრიტიკული მნიშვნელობის დასადგენად, თქვენ უნდა გამოიყენოთ მნიშვნელოვნების დონე, როგორც FDIST ფუნქციის ალბათობის არგუმენტი.

ალბათობის მნიშვნელობის გათვალისწინებით, FDIST ფუნქცია ეძებს x მნიშვნელობას, რომლისთვისაც FDIST(x,თავისუფლების_ხარისხები1,თავისუფლების_ხარისხები2) = ალბათობა. ამრიგად, FDIST ფუნქციის სიზუსტე დამოკიდებულია FDIST-ის სიზუსტეზე. საძიებლად, FRIST ფუნქცია იყენებს გამეორების მეთოდს. თუ ძიება არ დასრულდება 100 გამეორების შემდეგ, #N/A შეცდომის მნიშვნელობა დაბრუნდება.

მაგალითი

დააკოპირეთ ნიმუშის მონაცემები შემდეგი ცხრილიდან და ჩასვით იგი ახალი Excel-ის სამუშაო ფურცლის A1 უჯრედში. ფორმულების შედეგების სანახავად აირჩიეთ ისინი და დააჭირეთ F2, შემდეგ დააჭირეთ Enter. საჭიროების შემთხვევაში, შეცვალეთ სვეტების სიგანე, რომ ნახოთ ყველა მონაცემი.



გაქვთ შეკითხვები?

შეატყობინეთ შეცდომას

ტექსტი, რომელიც გაეგზავნება ჩვენს რედაქტორებს: