როგორ გამოვთვალოთ პირსონის კორელაცია Excel-ში. ნორმალური განაწილების ჰიპოთეზის ტესტირება. წყვილის კორელაციის კოეფიციენტის მატრიცა Excel-ში

ლაბორატორიული სამუშაოები

კორელაციური ანალიზი შიEXCEL

1.1 კორელაციური ანალიზი MS Excel-ში

კორელაციური ანალიზი შედგება ორი შემთხვევითი ცვლადის X და Y შორის კავშირის ხარისხის განსაზღვრისგან. ასეთი კავშირის საზომად გამოიყენება კორელაციის კოეფიციენტი. კორელაციის კოეფიციენტი შეფასებულია n დაკავშირებული დაკვირვების წყვილის ნიმუშიდან (x i, y i) X და Y ერთობლივი პოპულაციისგან. რაოდენობრივ მასშტაბებში გაზომილი X და Y მნიშვნელობებს შორის კავშირის ხარისხის შესაფასებლად, გამოიყენება წრფივი კორელაციის კოეფიციენტი(პირსონის კოეფიციენტი), რომელიც ვარაუდობს, რომ ნიმუშები X და Y ჩვეულებრივ განაწილებულია.

კორელაციის კოეფიციენტი მერყეობს -1-დან (მკაცრი შებრუნებული წრფივი კავშირი) 1-მდე (მკაცრი პირდაპირპროპორციული ურთიერთობა). 0-ზე დაყენებისას, ორ ნიმუშს შორის არ არის წრფივი კავშირი.

კორელაციების ზოგადი კლასიფიკაცია (ივანტერ ე.ვ., კოროსოვი ა.ვ., 1992 წლის მიხედვით):

არსებობს კორელაციის კოეფიციენტების რამდენიმე ტიპი, რაც დამოკიდებულია X და Y ცვლადებზე, რომლებიც შეიძლება გაიზომოს სხვადასხვა მასშტაბით. ეს არის ის ფაქტი, რომელიც განსაზღვრავს შესაბამისი კორელაციის კოეფიციენტის არჩევანს (იხ. ცხრილი 13):

MS Excel-ში სპეციალური ფუნქცია გამოიყენება წყვილის ხაზოვანი კორელაციის კოეფიციენტების გამოსათვლელად CORREL (მასივი1; მასივი2),

საგნები

სადაც array1 არის მითითება პირველი შერჩევის უჯრედების დიაპაზონზე (X);

მაგალითი 1: 10 სკოლის მოსწავლეს ჩაუტარდა ტესტები ვიზუალურ-ფიგურალური და ვერბალური აზროვნებისთვის. ტესტის ამოცანების ამოხსნის საშუალო დრო გაზომილი იყო წამებში. მკვლევარს აინტერესებს კითხვა: არის თუ არა კავშირი ამ პრობლემების გადაჭრისთვის საჭირო დროს? ცვლადი X აღნიშნავს ვიზუალურ-ფიგურული ტესტების ამოხსნის საშუალო დროს, ხოლო ცვლადი Y აღნიშნავს ვერბალური ტესტის ამოცანების ამოხსნის საშუალო დროს.

გამოსავალი:ურთიერთობის ხარისხის დასადგენად, უპირველეს ყოვლისა, აუცილებელია მონაცემების შეტანა MS Excel ცხრილში (იხ. ცხრილი, სურ. 1). შემდეგ გამოითვლება კორელაციის კოეფიციენტის მნიშვნელობა. ამისათვის მოათავსეთ კურსორი C1 უჯრედში. ინსტრუმენტთა პანელზე დააწკაპუნეთ ღილაკზე Insert Function (fx).

Feature Wizard დიალოგურ ფანჯარაში, რომელიც გამოჩნდება, აირჩიეთ კატეგორია სტატისტიკურიდა ფუნქცია კორელიდა შემდეგ დააწკაპუნეთ OK. მაუსის მაჩვენებლის გამოყენებით შეიყვანეთ მონაცემთა ნიმუშის დიაპაზონი X მასივის1 (A1:A10) ველში. მასივის2 ველში შეიყვანეთ მონაცემთა ნიმუშის დიაპაზონი Y (B1:B10). დააწკაპუნეთ OK. C1 უჯრედში გამოჩნდება კორელაციის კოეფიციენტის მნიშვნელობა - 0.54119. შემდეგი, თქვენ უნდა დაათვალიეროთ კორელაციის კოეფიციენტის აბსოლუტური რაოდენობა და დაადგინოთ კავშირის ტიპი (ახლო, სუსტი, საშუალო და ა.შ.)

ბრინჯი. 1. კორელაციის კოეფიციენტის გამოთვლის შედეგები

ამდენად, კავშირი ვიზუალურ-ფიგურალური და ვერბალური ტესტური ამოცანების ამოხსნის დროს დადასტურებული არ არის.

დავალება 1.მონაცემები ხელმისაწვდომია 20 სასოფლო-სამეურნეო მეურნეობის შესახებ. იპოვე კორელაციის კოეფიციენტიმარცვლეული კულტურების მოსავლიანობასა და მიწის ხარისხს შორის და შეაფასოს მისი მნიშვნელობა. მონაცემები ნაჩვენებია ცხრილში.

ცხრილი 2. მარცვლეულის მოსავლიანობის დამოკიდებულება მიწის ხარისხზე

ფერმის ნომერი

მიწის ხარისხი, ქულა

პროდუქტიულობა, ც/ჰა


დავალება 2.დაადგინეთ არის თუ არა კავშირი სპორტული ფიტნეს სიმულატორის მუშაობის დროს (ათასი საათი) და მისი შეკეთების ღირებულებას (ათასი რუბლი):

სიმულატორის მუშაობის დრო (ათასი საათი)

რემონტის ღირებულება (ათასი რუბლი)

1.2 მრავალჯერადი კორელაცია MS Excel-ში

ზე დიდი რაოდენობადაკვირვებები, როდესაც კორელაციის კოეფიციენტები თანმიმდევრულად უნდა გამოითვალოს რამდენიმე ნიმუშისთვის, მოხერხებულობისთვის, მიღებული კოეფიციენტები შეჯამებულია ცხრილებში ე.წ. კორელაციის მატრიცები.

კორელაციის მატრიცაარის კვადრატული ცხრილი, რომელშიც შესაბამისი სტრიქონების და სვეტების გადაკვეთაზე არის შესაბამის პარამეტრებს შორის კორელაციის კოეფიციენტი.

MS Excel-ში პროცედურა გამოიყენება კორელაციის მატრიცების გამოსათვლელად კორელაციაპაკეტიდან მონაცემთა ანალიზი.პროცედურა საშუალებას გვაძლევს მივიღოთ კორელაციის მატრიცა, რომელიც შეიცავს კორელაციის კოეფიციენტებს სხვადასხვა პარამეტრებს შორის.

პროცედურის განსახორციელებლად საჭიროა:

1. შეასრულეთ ბრძანება სერვისი - ანალიზი მონაცემები;

2. სიაში, რომელიც გამოჩნდება ანალიზის ინსტრუმენტებიაირჩიეთ ხაზი კორელაციადა დააჭირეთ ღილაკს OK;

3. დიალოგურ ფანჯარაში, რომელიც გამოჩნდება, მიუთითეთ შეყვანის ინტერვალი, ანუ შეიტანეთ ბმული უჯრედებზე, რომლებიც შეიცავს გაანალიზებულ მონაცემებს. შეყვანის ინტერვალი უნდა შეიცავდეს მინიმუმ ორ სვეტს.

4. განყოფილებაში დაჯგუფებაჩამრთველის დაყენება შეყვანილი მონაცემების შესაბამისად (სვეტებით ან რიგებით);

5. მიუთითეთ დასვენების დღე ინტერვალი, ანუ შეიტანეთ ბმული უჯრედზე, საიდანაც ნაჩვენები იქნება ანალიზის შედეგები. გამომავალი დიაპაზონის ზომა ავტომატურად განისაზღვრება და გამოჩნდება შეტყობინება, თუ გამომავალი დიაპაზონი შეიძლება გადაფაროს წყაროს მონაცემებთან. დააჭირეთ ღილაკს OK.

გამომავალი დიაპაზონში გამოვა კორელაციის მატრიცა, რომელშიც თითოეული მწკრივისა და სვეტის გადაკვეთაზე არის კორელაციის კოეფიციენტი შესაბამის პარამეტრებს შორის. გამომავალი დიაპაზონის უჯრედები, რომლებსაც აქვთ მწკრივის და სვეტის შესატყვისი კოორდინატები, შეიცავს მნიშვნელობას 1, რადგან თითოეული სვეტი არის შეყვანის დიაპაზონიმთლიანად დაკავშირებულია საკუთარ თავთან

მაგალითი 2.არსებობს ყოველთვიური დაკვირვების მონაცემები ამინდის პირობებისა და მუზეუმებსა და პარკებში დასწრების შესახებ (იხ. ცხრილი 3). აუცილებელია დადგინდეს, არის თუ არა კავშირი ამინდის პირობებსა და მუზეუმებსა და პარკებში დასწრებას შორის.

ცხრილი 3. დაკვირვების შედეგები

ნათელი დღეების რაოდენობა

მუზეუმის ვიზიტორთა რაოდენობა

პარკის ვიზიტორების რაოდენობა

გამოსავალი. კორელაციური ანალიზის შესასრულებლად შეიყვანეთ ორიგინალური მონაცემები A1:G3 დიაპაზონში (ნახ. 2). შემდეგ მენიუში სერვისიაირჩიეთ ელემენტი ანალიზი მონაცემებიდა შემდეგ შეიტანეთ ხაზი კორელაცია. დიალოგურ ფანჯარაში, რომელიც გამოჩნდება, მიუთითეთ შეყვანის ინტერვალი(A2:C7). მიუთითეთ, რომ მონაცემები განიხილება სვეტებად. მიუთითეთ გამომავალი დიაპაზონი (E1) და დააჭირეთ ღილაკს OK.

ნახ. 33 გვიჩვენებს, რომ კორელაცია ამინდის პირობებსა და მუზეუმში დასწრებას შორის არის -0.92, ამინდის პირობებსა და პარკში დასწრებას შორის არის 0.97, ხოლო პარკსა და მუზეუმში დასწრებას შორის არის 0.92.

ამრიგად, ანალიზის შედეგად გამოვლინდა დამოკიდებულებები: მუზეუმის დასწრებასა და მზიან დღეებს შორის შებრუნებული წრფივი კავშირის ძლიერი ხარისხი და პარკში დასწრებასა და ამინდის პირობებს შორის თითქმის წრფივი (ძალიან ძლიერი პირდაპირი) ურთიერთობა. არსებობს ძლიერი საპირისპირო კავშირი მუზეუმსა და პარკში დასწრებას შორის.

ბრინჯი. 2. კორელაციის მატრიცის გამოთვლის შედეგები მე-2 მაგალითიდან

დავალება 3. მენეჯერის პიროვნების ფსიქოლოგიური მახასიათებლების საექსპერტო შეფასების მეთოდით შეფასდა 10 მენეჯერი. 15 ექსპერტმა შეაფასა თითოეული ფსიქოლოგიური მახასიათებელი ხუთპუნქტიანი სისტემის გამოყენებით (იხ. ცხრილი 4). ფსიქოლოგს აინტერესებს ლიდერის ამ მახასიათებლებს შორის ურთიერთკავშირის საკითხი.

ცხრილი 4. კვლევის შედეგები

საგნები

ტაქტიკა

სიზუსტე

კრიტიკულობა

დღევანდელ სტატიაში ვისაუბრებთ იმაზე, თუ როგორ შეიძლება იყოს დაკავშირებული ცვლადები ერთმანეთთან. კორელაციის გამოყენებით შეგვიძლია განვსაზღვროთ არის თუ არა კავშირი პირველ და მეორე ცვლადს შორის. ვიმედოვნებ, რომ ეს აქტივობა ისევე სახალისო იქნება, როგორც წინა!

კორელაცია ზომავს x-სა და y-ს შორის ურთიერთობის სიძლიერეს და მიმართულებას. ფიგურა აჩვენებს სხვადასხვა სახისკორელაციები მოწესრიგებული წყვილების (x, y) სკატერული ნაკვეთების სახით. ტრადიციულად, x ცვლადი მოთავსებულია ჰორიზონტალურ ღერძზე, ხოლო y ცვლადი მოთავსებულია ვერტიკალურ ღერძზე.

გრაფიკი A არის დადებითი წრფივი კორელაციის მაგალითი: x იზრდება, y ასევე იზრდება და წრფივად. B გრაფიკი გვიჩვენებს უარყოფითი წრფივი კორელაციის მაგალითს, სადაც x იზრდება, y წრფივად მცირდება. C გრაფიკზე ვხედავთ, რომ x და y-ს შორის კორელაცია არ არსებობს. ეს ცვლადები არავითარ გავლენას არ ახდენს ერთმანეთზე.

და ბოლოს, გრაფიკი D არის ცვლადებს შორის არაწრფივი ურთიერთობების მაგალითი. როგორც x იზრდება, y ჯერ მცირდება, შემდეგ იცვლის მიმართულებას და იზრდება.

სტატიის დარჩენილი ნაწილი ყურადღებას ამახვილებს დამოკიდებულ და დამოუკიდებელ ცვლადებს შორის ხაზოვან ურთიერთობებზე.

კორელაციის კოეფიციენტი

კორელაციის კოეფიციენტი r გვაწვდის როგორც დამოუკიდებელ და დამოკიდებულ ცვლადებს შორის ურთიერთობის ძალას და მიმართულებას. r-ის მნიშვნელობები მერყეობს - 1.0-დან + 1.0-მდე. როდესაც r დადებითია, x-სა და y-ს შორის კავშირი დადებითია (გრაფიკი A ნახატზე), ხოლო როდესაც r უარყოფითია, კავშირი ასევე უარყოფითია (გრაფიკი B). ნულთან მიახლოებული კორელაციის კოეფიციენტი მიუთითებს, რომ x-სა და y-ს შორის კავშირი არ არის (გრაფიკი C).

x-სა და y-ს შორის კავშირის სიძლიერე განისაზღვრება იმით, არის თუ არა კორელაციის კოეფიციენტი - 1.0-თან თუ +- 1.0-თან. შეისწავლეთ შემდეგი ნახატი.

გრაფიკი A გვიჩვენებს სრულყოფილ დადებით კორელაციას x და y-ს შორის r = + 1.0-ზე. გრაფიკი B - იდეალური უარყოფითი კორელაცია x და y-ს შორის r = - 1.0. გრაფიკები C და D - მეტი მაგალითი სუსტი კავშირებიდამოკიდებულ და დამოუკიდებელ ცვლადებს შორის.

კორელაციის კოეფიციენტი, r, განსაზღვრავს დამოკიდებულ და დამოუკიდებელ ცვლადებს შორის ურთიერთობის სიძლიერეს და მიმართულებას. r მნიშვნელობები მერყეობს - 1.0-დან (ძლიერი უარყოფითი კავშირი) + 1.0-მდე (ძლიერი დადებითი ურთიერთობა). როდესაც r = 0 არ არსებობს კავშირი x და y ცვლადებს შორის.

ჩვენ შეგვიძლია გამოვთვალოთ ფაქტობრივი კორელაციის კოეფიციენტი შემდეგი განტოლების გამოყენებით:

აბა, კარგად! მე ვიცი, რომ ეს განტოლება საშინელ არეულობას ჰგავს უცნაური პერსონაჟები, მაგრამ სანამ პანიკაში ჩავვარდებით, მოდით გამოვიყენოთ მასზე საგამოცდო კლასის მაგალითი. ვთქვათ, მინდა დავადგინო, არის თუ არა კავშირი სტუდენტის მიერ სტატისტიკის შესწავლას დათმობილი საათებისა და საბოლოო გამოცდის ქულას შორის. ქვემოთ მოყვანილი ცხრილი დაგვეხმარება დავშალოთ ეს განტოლება რამდენიმე მარტივ გამოთვლად და გავხადოთ ისინი უფრო მართვადი.

როგორც ხედავთ, ძალიან ძლიერი დადებითი კორელაციაა საგნის შესწავლისთვის დათმობილი საათების რაოდენობასა და საგამოცდო ხარისხს შორის. მასწავლებლები დიდი სიამოვნებით გაიგებენ ამის შესახებ.

რა სარგებელი მოაქვს მსგავს ცვლადებს შორის ურთიერთობების დამყარებას? დიდი კითხვა. თუ დადგინდა, რომ ურთიერთობა არსებობს, ჩვენ შეგვიძლია ვიწინასწარმეტყველოთ გამოცდის შედეგები გარკვეული თანხასაგნის შესწავლას დათმობილი საათი. მარტივად რომ ვთქვათ, რაც უფრო ძლიერი იქნება კავშირი, მით უფრო ზუსტი იქნება ჩვენი პროგნოზი.

Excel-ის გამოყენება კორელაციის კოეფიციენტების გამოსათვლელად

დარწმუნებული ვარ, რომ როდესაც შეხედავთ კორელაციის კოეფიციენტების ამ საშინელ გამოთვლებს, ნამდვილად გაგიხარდებათ ამის ცოდნა Excel პროგრამაშეუძლია გააკეთოს ეს ყველაფერი თქვენთვის CORREL ფუნქციის გამოყენებით შემდეგი მახასიათებლებით:

CORREL (მაივი 1; მასივი 2),

მასივი 1 = მონაცემთა დიაპაზონი პირველი ცვლადისთვის,

მასივი 2 = მონაცემთა დიაპაზონი მეორე ცვლადისთვის.

მაგალითად, ფიგურაში ნაჩვენებია CORREL ფუნქცია, რომელიც გამოიყენება კორელაციის კოეფიციენტის გამოსათვლელად საგამოცდო კლასის მაგალითისთვის.

1.გახსენით Excel

2. მონაცემთა სვეტების შექმნა. ჩვენს მაგალითში განვიხილავთ პირველკლასელებში აგრესიასა და თავდაჯერებულობას შორის ურთიერთობას, ანუ კორელაციას. ექსპერიმენტში 30 ბავშვი მონაწილეობდა, მონაცემები მოცემულია Excel-ის ცხრილში:

1 სვეტი - თემის ნომერი

2 სვეტი - აგრესიულობაქულებში

3 სვეტი - საკუთარ თავში ეჭვიქულებში

3.მაშინ თქვენ უნდა აირჩიოთ ცხრილის გვერდით ცარიელი უჯრედი და დააწკაპუნოთ ხატულაზე f(x) Excel პანელში

4.ფუნქციის მენიუ გაიხსნება, თქვენ უნდა აირჩიოთ კატეგორიებიდან სტატისტიკური და შემდეგ ფუნქციების ჩამონათვალში ანბანურად იპოვეთ კორელიდა დააწკაპუნეთ OK

5.შემდეგ გაიხსნება ფუნქციის არგუმენტების მენიუ, რომელიც მოგცემთ საშუალებას აირჩიოთ ჩვენთვის საჭირო მონაცემთა სვეტები. პირველი სვეტის შესარჩევად აგრესიულობათქვენ უნდა დააჭიროთ ლურჯ ღილაკს ხაზის გვერდით მასივი 1

6. აირჩიეთ მონაცემები მასივი 1სვეტიდან აგრესიულობადა დააწკაპუნეთ ლურჯ ღილაკს დიალოგურ ფანჯარაში

7. შემდეგ, მასივის 1-ის მსგავსად, დააწკაპუნეთ ლურჯ ღილაკს ხაზის გვერდით მასივი2

8. აირჩიეთ მონაცემები მასივი2- სვეტი საკუთარ თავში ეჭვიდა კვლავ დააჭირეთ ლურჯ ღილაკს, შემდეგ OK

9. აქ რ-პირსონის კორელაციის კოეფიციენტი გამოითვალა და ჩაიწერა არჩეულ უჯრედში, ის დადებითია და დაახლოებით ტოლია 0,225 . ამაზეა საუბარი ზომიერი დადებითიპირველკლასელებში აგრესიულობასა და თავდაჯერებულობას შორის კავშირი

ამრიგად, სტატისტიკური დასკვნაექსპერიმენტი იქნება: r = 0.225, გამოვლინდა ზომიერი დადებითი კავშირი ცვლადებს შორის აგრესიულობადა საკუთარ თავში ეჭვი.

ზოგიერთი კვლევა მოითხოვს კორელაციის კოეფიციენტის მნიშვნელოვნების p- დონის დაზუსტებას, მაგრამ Excel, SPSS-ისგან განსხვავებით, არ იძლევა ამ ვარიანტს. არა უშავს, არის (A.D. Nasledov).

ის ასევე შეგიძლიათ დაურთოთ კვლევის შედეგებს.

დავალება 1.

პირსონის ტესტის გამოყენება, მნიშვნელოვნების დონეზე = 0.05 შეამოწმეთ, შეესაბამება თუ არა ჰიპოთეზა პოპულაციის ნორმალური განაწილების შესახებ Xნიმუშის ზომის ემპირიული განაწილებით = 200.

გამოსავალი.

1. გამოვთვალოთ და ნიმუშის სტანდარტული გადახრა .
2. გამოვთვალოთ თეორიული სიხშირეები იმის გათვალისწინებით = 200, = 2, = 4.695, ფორმულის მიხედვით
.

შევადგინოთ გაანგარიშების ცხრილი(ფუნქციის მნიშვნელობები (x) მოცემულია დანართ 1-ში).


მე

3. შევადაროთ ემპირიული და თეორიული სიხშირეები. შევქმნათ საანგარიშო ცხრილი, საიდანაც ვიპოვით კრიტერიუმის დაკვირვებულ მნიშვნელობას :


მე
ჯამი

კრიტიკული განაწილების წერტილების ცხრილის მიხედვით (დანართი 6), მნიშვნელოვნების დონის მიხედვით = 0.05 და თავისუფლების გრადუსების რაოდენობა = – 3 = 9 – 3 = 6 ვპოულობთ მარჯვენა კრიტიკული რეგიონის კრიტიკულ წერტილს (0.05; 6) = 12.6.
ვინაიდან =22.2 > = 12.6, ჩვენ უარვყოფთ ჰიპოთეზას პოპულაციის ნორმალური განაწილების შესახებ. სხვა სიტყვებით რომ ვთქვათ, ემპირიული და თეორიული სიხშირეები მნიშვნელოვნად განსხვავდება.

პრობლემა 2

წარმოდგენილია სტატისტიკური მონაცემები.

დიამეტრის გაზომვის შედეგები = 200 რულონი დაფქვის შემდეგ შეჯამებულია ცხრილში. (მმ):
მაგიდარულონების დიამეტრის სიხშირის ცვალებადობის სერია

მე

xi, მმ

xi, მმ

საჭირო:

1) დისკრეტული ვარიაციის სერიის შედგენა, საჭიროების შემთხვევაში მისი შეკვეთა;

2) სერიის ძირითადი რიცხვითი მახასიათებლების განსაზღვრა;

3) მისცეს გრაფიკული წარმოდგენასერია განაწილების მრავალკუთხედის (ჰისტოგრამის) სახით;

4) ააგეთ თეორიული ნორმალური განაწილების მრუდი და შეამოწმეთ ემპირიული და თეორიული განაწილების შესაბამისობა პირსონის კრიტერიუმის გამოყენებით. განაწილების ტიპის შესახებ სტატისტიკური ჰიპოთეზის ტესტირებისას მიიღეთ მნიშვნელოვნების დონე a = 0.05

გამოსავალი: ჩვენ ვიპოვით მოცემული ვარიაციების სერიის ძირითად რიცხვობრივ მახასიათებლებს განმარტებით. რულონების საშუალო დიამეტრია (მმ):
xსაშუალო = = 6.753;
შესწორებული დისპერსია (მმ2):
= = 0,0009166;
შესწორებული საშუალო კვადრატული (სტანდარტული) გადახრა (მმ):
= = 0,03028.


ბრინჯი.რულონების დიამეტრის სიხშირის განაწილება

ვარიაციის სერიის ორიგინალური („ნედლეული“) სიხშირის განაწილება, ე.ი. მიმოწერა ნი(xi), გამოირჩევა ღირებულებების საკმაოდ დიდი გავრცელებით ნიზოგიერთი ჰიპოთეტური "საშუალო" მრუდის შედარებით (ნახ.). ამ შემთხვევაში სასურველია ავაშენოთ და გავაანალიზოთ ინტერვალის ცვალებადობის სერია, რომელიც აერთიანებს სიხშირეებს დიამეტრებისთვის, რომლებიც ხვდება შესაბამის ინტერვალებში.
ინტერვალური ჯგუფების რაოდენობა მოდით განვსაზღვროთ იგი Sturgess-ის ფორმულის გამოყენებით:
= 1 + log2 = 1 + 3.322ლგ ,
სად = 200 - ნიმუშის ზომა. ჩვენს შემთხვევაში
= 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
ინტერვალის სიგანეა (6,83 – 6,68)/8 = 0,01875 » 0,02 მმ.
ინტერვალის ვარიაციების სერია წარმოდგენილია ცხრილში.

ცხრილი რულონების დიამეტრის სიხშირის ინტერვალის ცვალებადობის სერია.

xk, მმ

ინტერვალის სერია შეიძლება ვიზუალურად იყოს წარმოდგენილი სიხშირის განაწილების ჰისტოგრამის სახით.


ბრინჯი. რულონების დიამეტრის სიხშირის განაწილება. მყარი ხაზი- ნორმალური მრუდის გასწორება.

ჰისტოგრამის გარეგნობა საშუალებას გვაძლევს გამოვიტანოთ ვარაუდი, რომ რულონების დიამეტრის განაწილება ემორჩილება ნორმალურ კანონს, რომლის მიხედვითაც თეორიული სიხშირეები შეიძლება მოიძებნოს როგორც
ნკ, თეორია = × (; ს; xk)×D xk,
სადაც, თავის მხრივ, ნორმალური განაწილების გლუვის გაუსის მრუდი განისაზღვრება გამოსახულებით:
(; ს; xk) = .
ამ გამონათქვამებში xk– ინტერვალების ცენტრები სიხშირის ინტერვალის ცვალებადობის სერიაში.

მაგალითად, x 1 = (6.68 + 6.70)/2 = 6.69. როგორც ცენტრის შეფასებები და გაუსის მრუდის პარამეტრი s შეიძლება იქნას მიღებული:
= xოთხ
ნახ. ჩანს, რომ გაუსის ნორმალური განაწილების მრუდი ზოგადად შეესაბამება ემპირიულ ინტერვალურ განაწილებას. თუმცა, თქვენ უნდა დარწმუნდეთ სტატისტიკური მნიშვნელობაეს მიმოწერა. ემპირიული განაწილების შესაბამისობის შესამოწმებლად ემპირიულ განაწილებასთან, ვიყენებთ Pearson-ის სიკეთე-of-fit კრიტერიუმს c2. ამისათვის გამოთვალეთ კრიტერიუმის ემპირიული მნიშვნელობა ჯამის სახით
= ,
სად ნკდა ნკ,თეორია – შესაბამისად ემპირიული და თეორიული (ნორმალური) სიხშირეები. მოსახერხებელია გაანგარიშების შედეგების წარმოდგენა ცხრილის ფორმა:
მაგიდაპირსონის ტესტის გამოთვლები


[xk, xk+ 1), მმ

xk, მმ

ნკ, თეორია

კრიტიკული ღირებულებაჩვენ ვიპოვით კრიტერიუმს პირსონის ცხრილის გამოყენებით მნიშვნელოვნების დონის a = 0.05 და თავისუფლების გრადუსების რაოდენობისთვის .. = – 1 – , სად = 8 – ინტერვალის ვარიაციის სერიის ინტერვალების რაოდენობა; = 2 - თეორიული განაწილების პარამეტრების რაოდენობა შეფასებული ნიმუშის მონაცემების საფუძველზე (in ამ შემთხვევაში, – პარამეტრები და ს). ამრიგად, .. = 5. პირსონის კრიტერიუმის კრიტიკული მნიშვნელობა არის crit(a; ..) = 11.1. მას შემდეგ, რაც c2emp< c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

პრობლემა 3

შოკოლადის ყუთები იფუთება ავტომატურად. შემთხვევითი, განმეორებადი შერჩევის სქემის მიხედვით, 2000 შეფუთვიდან 130 იქნა აღებული პარტიაში და მიღებული იქნა შემდეგი მონაცემები მათი წონის შესახებ:

საჭიროა პირსონის ტესტის გამოყენება a=0.05 მნიშვნელოვნების დონეზე ჰიპოთეზის შესამოწმებლად, რომ შემთხვევითი ცვლადი X - პაკეტების წონა - ნაწილდება ჩვეულებრივი კანონის მიხედვით. ააგეთ ემპირიული განაწილების ჰისტოგრამა და შესაბამისი ნორმალური მრუდი ერთ გრაფიკზე.

გამოსავალი

1012,5
= 615,3846

შენიშვნა:

პრინციპში, შესწორებული ნიმუშის განსხვავება უნდა იქნას მიღებული, როგორც ნორმალური განაწილების კანონის ვარიაცია. მაგრამ იმიტომ დაკვირვებების რაოდენობა - 130 საკმარისად დიდია, მაშინ "ჩვეულებრივი" გააკეთებს.
ამრიგად, თეორიული ნორმალური განაწილება არის:

ინტერვალი

[xi ; xi+1]

ემპირიული სიხშირეები

ნი

ალბათობები
პი

თეორიული სიხშირეები
npi

(ნი-ნპი)2

PEARSON ფუნქცია (ინგლისურად შეიყვანეთ PEARSON) შექმნილია პირსონის კორელაციის კოეფიციენტის r გამოსათვლელად. ეს ფუნქციაგამოიყენება სამუშაოში, როდესაც აუცილებელია ხარისხის ასახვა ხაზოვანი დამოკიდებულებამონაცემთა ორ ნაკრებს შორის. Excel-ში არის რამდენიმე ფუნქცია, რომელთა გამოყენება შესაძლებელია ერთი და იგივე შედეგის მისაღებად, მაგრამ Pearson-ის ფუნქციის მრავალფეროვნება და სიმარტივე მას არჩევანს ხდის.

როგორ მუშაობს PEARSON ფუნქცია Excel-ში?

მოდით შევხედოთ პირსონის კორელაციის გაანგარიშების მაგალითს მონაცემთა ორ ნაკრებს შორის PEARSON ფუნქციის გამოყენებით MS EXCEL-ში. პირველი მასივი წარმოადგენს ტემპერატურის მნიშვნელობებს, მეორე არის წნევა ზაფხულის გარკვეულ პერიოდში. შევსებული ცხრილის მაგალითი ნაჩვენებია სურათზე:

დავალება ასეთია: აუცილებელია ივნისის თვის ტემპერატურასა და წნევას შორის კავშირის დადგენა.

ამოხსნის მაგალითი PEARSON ფუნქციით Excel-ში გაანალიზებისას


ეს მაჩვენებელი -0.14 პირსონის მიხედვით, რომელიც დაბრუნდა ფუნქციით, მიუთითებს არასახარბიელო ურთიერთობაზე ტემპერატურასა და წნევას შორის დღის პირველ საათებში.



PEARSON ფუნქციის ეტაპობრივი ინსტრუქციები

კორელაციის კოეფიციენტი რაოდენობრივი მახასიათებლების შემთხვევითობის ყველაზე მოსახერხებელი მაჩვენებელია.

დავალება: პირსონის წრფივი კორელაციის კოეფიციენტის განსაზღვრა.

გამოსავლის მაგალითი:

ამრიგად, გაანგარიშების შედეგის მიხედვით, ექსპერიმენტის სტატისტიკურმა დასკვნამ გამოავლინა უარყოფითი კავშირი ასაკსა და დღეში მოწეული სიგარეტის რაოდენობას შორის.

პირსონის კორელაციის ანალიზი Excel-ში

დავალება: სკოლის მოსწავლეებს ჩაუტარდათ ვიზუალური და ვერბალური აზროვნების ტესტები. ტესტის ამოცანების ამოხსნის საშუალო დრო გაზომილი იყო წამებში. ფსიქოლოგს აინტერესებს კითხვა: არის თუ არა კავშირი ამ პრობლემების გადაჭრას შორის?

ამოხსნის მაგალითი: წარმოვადგინოთ საწყისი მონაცემები ცხრილის სახით:


პირსონის გამოთვლის შედეგის ინტერპრეტაცია

პირსონის წრფივი კორელაციის კოეფიციენტის მნიშვნელობა არ შეიძლება აღემატებოდეს +1 და იყოს -1-ზე ნაკლები. ეს ორი რიცხვი +1 და -1 არის კორელაციის კოეფიციენტის საზღვრები. როდესაც გაანგარიშების შედეგად მიიღება მნიშვნელობა +1-ზე მეტი ან -1-ზე ნაკლები, შესაბამისად, მოხდა შეცდომა გამოთვლებში.

თუ კორელაციის კოეფიციენტი მოდულში აღმოჩნდება 1-თან ახლოს, მაშინ ეს შეესაბამება მაღალი დონისცვლადებს შორის კავშირები.

თუ მიიღება მინუს ნიშანი, მაშინ ერთი მახასიათებლის უფრო დიდი მნიშვნელობა შეესაბამება მეორის უფრო მცირე მნიშვნელობას. სხვა სიტყვებით რომ ვთქვათ, თუ არის მინუს ნიშანი, ერთი ცვლადის (ნიშანი, მნიშვნელობა) ზრდა შეესაბამება მეორე ცვლადის შემცირებას. ამ სახის დამოკიდებულებას საპირისპირო ეწოდება პროპორციული დამოკიდებულება. ძალიან მნიშვნელოვანია ამ დებულებების მკაფიოდ გაგება მიღებული კორელაციური დამოკიდებულების სწორი ინტერპრეტაციისთვის.



რაიმე შეკითხვა?

შეატყობინეთ შეცდომას

ტექსტი, რომელიც გაეგზავნება ჩვენს რედაქტორებს: