แบบจำลองเศรษฐมิติของสมการพหุคูณเชิงเส้น การพยากรณ์โดยใช้แบบจำลองการถดถอยพหุคูณ ปริมาณเรียกว่า...
การพยากรณ์โดยใช้หลายแบบจำลอง การถดถอยเชิงเส้นเกี่ยวข้องกับการประมาณค่าที่คาดหวังของตัวแปรตามเมื่อใด ตั้งค่า x ตัวแปรอิสระรวมอยู่ในสมการการถดถอย มีการพยากรณ์จุดและช่วงเวลา
พยากรณ์จุด - นี้ ค่าที่คำนวณได้ตัวแปรตามที่ได้จากการแทนที่ค่าที่ทำนายไว้ (กำหนดโดยผู้วิจัย) ของตัวแปรอิสระลงในสมการถดถอยเชิงเส้นพหุคูณ หากระบุค่าไว้ ค่าที่ทำนายของตัวแปรตาม (การพยากรณ์จุด) จะเท่ากับ
การคาดการณ์ช่วง - นี่คือขั้นต่ำและ ค่าสูงสุดตัวแปรตามในช่วงเวลาระหว่าง
ซึ่งตกอยู่กับระดับความน่าจะเป็นที่กำหนดและสำหรับค่าที่กำหนดของตัวแปรอิสระ
การคาดการณ์ช่วงเวลาสำหรับ ฟังก์ชันเชิงเส้นคำนวณโดยสูตร
ที่ไหน ที T – ค่าทางทฤษฎีของการทดสอบของนักเรียนที่ df=n- – เสื้อ– 1 องศาอิสระ; สคุณ – มาตรฐานบกพร่องพยากรณ์โดยคำนวณตามสูตร
(2.57)
ที่ไหน เอ็กซ์– เมทริกซ์ของค่าเริ่มต้นของตัวแปรอิสระ เอ็กซ์ pr – เมทริกซ์คอลัมน์ของค่าที่ทำนายของตัวแปรอิสระของแบบฟอร์ม
ให้เราค้นหาค่าที่คาดการณ์ของรายได้ภาษี (ตัวอย่าง 2.1) โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างตัวบ่งชี้นั้นอธิบายโดยสมการ
มาตั้งค่าทำนายของตัวแปรอิสระกัน:
- – จำนวนการจ้างงาน Xj: 500,000 คน
- – ปริมาณการขนส่งในอุตสาหกรรมการผลิต เอ็กซ์ 2: 65,000 ล้านรูเบิล;
- – การผลิตพลังงาน x3: 15,000 ล้านรูเบิล
เรามาค้นหาจุดและช่วงเวลาของการคาดการณ์รายได้ภาษีกันดีกว่า
สำหรับค่าตัวแปรอิสระที่กำหนด ใบเสร็จรับเงินภาษีโดยเฉลี่ยจะเท่ากับ
เวกเตอร์ของค่าทำนายของตัวแปรอิสระจะมีรูปแบบ
ข้อผิดพลาดในการคาดการณ์ซึ่งคำนวณโดยใช้สูตร (2.57) คือ 5556.7 ค่าตาราง t-test สำหรับจำนวนองศาอิสระ ดีเอฟ = 44 และระดับนัยสำคัญ a = 0.05 คือ 2.0154 ดังนั้นค่าที่คาดการณ์ของรายได้ภาษีจะอยู่ภายในขอบเขต 0.95:
จาก 18,013.69 – 2.0154-5556.7=6814.1 ล้านรูเบิล;
มากถึง 18,013.69 + 2.0154-5556.7 = 29,212 ล้านรูเบิล
การพยากรณ์โดยใช้แบบจำลองไม่เชิงเส้น การถดถอยหลายครั้งยังสามารถดำเนินการได้โดยใช้สูตร (2.55)–(2.57) โดยทำให้แบบจำลองที่ระบุเป็นเส้นตรงก่อนหน้านี้
ความหลากหลายของข้อมูล
เมื่อก่อสร้าง แบบจำลองเศรษฐมิติสันนิษฐานว่าตัวแปรอิสระมีอิทธิพลต่อตัวแปรตามแยกกัน กล่าวคือ อิทธิพลของตัวแปรตัวเดียวต่อคุณลักษณะผลลัพธ์ไม่สัมพันธ์กับอิทธิพลของตัวแปรอื่น ในความเป็นจริงทางเศรษฐกิจที่แท้จริง ปรากฏการณ์ทั้งหมดเชื่อมโยงกันในระดับหนึ่ง ดังนั้นจึงแทบจะเป็นไปไม่ได้เลยที่จะบรรลุสมมติฐานนี้ การมีอยู่ของการเชื่อมโยงระหว่างตัวแปรอิสระนำไปสู่ความจำเป็นในการประเมินอิทธิพลของมันต่อผลลัพธ์ของการวิเคราะห์ความสัมพันธ์และการถดถอย
มีความสัมพันธ์เชิงฟังก์ชันและสุ่มระหว่างตัวแปรอธิบาย ในกรณีแรก พวกเขาพูดถึงข้อผิดพลาดของข้อกำหนดโมเดลที่ต้องแก้ไข
การเชื่อมต่อเชิงฟังก์ชันจะเกิดขึ้นหากโดยเฉพาะอย่างยิ่ง ตัวแปรทั้งหมดที่รวมอยู่ในเอกลักษณ์ถูกรวมไว้ในสมการการถดถอยเป็นตัวแปรอธิบาย ตัวอย่างเช่น เราสามารถพูดได้ว่ารายได้ Y ประกอบด้วยการบริโภค C และการลงทุน ฉัน,กล่าวคือ การถือครองตัวตน เราถือว่าระดับนั้น อัตราดอกเบี้ย g ขึ้นอยู่กับรายได้เช่น รุ่นใน ปริทัศน์สามารถแสดงเป็นแบบฟอร์มได้
นักวิจัยที่ไม่มีประสบการณ์ซึ่งต้องการปรับปรุงแบบจำลองอาจรวมตัวแปร “การบริโภค” และ “การลงทุน” ไว้ในสมการ ซึ่งจะนำไปสู่ความสัมพันธ์เชิงหน้าที่ระหว่างตัวแปรอธิบาย:
ความสัมพันธ์เชิงฟังก์ชันของคอลัมน์เมทริกซ์ เอ็กซ์จะทำให้หาไม่ได้ การตัดสินใจเท่านั้นสมการ
การถดถอยเพราะว่า และการหาค่าผกผัน
เมทริกซ์เกี่ยวข้องกับการหาร การบวกพีชคณิตเมทริกซ์เข้าไปในดีเทอร์มิแนนต์ซึ่งได้รับมา
ไม่ว่าในกรณีใดมันจะเป็น เท่ากับศูนย์.
บ่อยครั้งที่มีความสัมพันธ์แบบสุ่มระหว่างตัวแปรอธิบาย ซึ่งนำไปสู่การลดลง
ค่าของดีเทอร์มิแนนต์ของเมทริกซ์: ยิ่งการเชื่อมต่อแข็งแกร่งขึ้น
ยิ่งดีเทอร์มิแนนต์จะเล็กลง สิ่งนี้นำไปสู่การเพิ่มขึ้นไม่เพียงแต่ในการประมาณค่าพารามิเตอร์ที่ได้รับโดยใช้กำลังสองน้อยที่สุดเท่านั้น แต่ยังรวมถึงข้อผิดพลาดมาตรฐานด้วยซึ่งคำนวณโดยใช้สูตร (2.24):
ซึ่งอย่างที่เราเห็นเมทริกซ์ก็ถูกใช้เช่นกัน ความสัมพันธ์สหสัมพันธ์สามารถมีอยู่ได้ทั้งระหว่างตัวแปรอธิบายสองตัว ( ความสัมพันธ์ระหว่างกัน) และระหว่างหลายรายการ (ความหลากหลาย)
มีสัญญาณหลายอย่างที่บ่งบอกถึงการมีอยู่ของความหลากหลาย โดยเฉพาะอย่างยิ่งสัญญาณดังกล่าวคือ:
- – สัญญาณของสัมประสิทธิ์การถดถอยที่ไม่สอดคล้องกับทฤษฎีเศรษฐศาสตร์ เช่น เรารู้ว่าตัวแปรอธิบาย เอ็กซ์มีผลกระทบโดยตรงต่อตัวแปร y ที่อธิบายไว้ ในขณะเดียวกัน ค่าสัมประสิทธิ์การถดถอยสำหรับตัวแปรนี้น้อยกว่าศูนย์
- – การเปลี่ยนแปลงที่สำคัญในพารามิเตอร์แบบจำลองโดยมีการลดลงเล็กน้อย (เพิ่มขึ้น) ในปริมาณประชากรภายใต้การศึกษา
- – ไม่มีนัยสำคัญของพารามิเตอร์การถดถอยเนื่องจากค่าข้อผิดพลาดมาตรฐานของพารามิเตอร์สูง
การมีอยู่ของความสัมพันธ์ระหว่างตัวแปรอิสระสามารถระบุได้โดยใช้ตัวบ่งชี้ความสัมพันธ์ระหว่างตัวแปรเหล่านั้น โดยเฉพาะการใช้สัมประสิทธิ์สหสัมพันธ์แบบคู่ ร XiX ซึ่งสามารถเขียนเป็นเมทริกซ์ได้
(2.58)
ค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรกับตัวมันเอง เท่ากับหนึ่ง (ช xx = 1) และค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปร* กับตัวแปร *,■ เท่ากับค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปร เอ็กซ์เจซีตัวแปร X, (ช x x =ร x x ). เพราะฉะนั้น, เมทริกซ์ที่กำหนดมีความสมมาตร ดังนั้นจึงระบุเฉพาะเส้นทแยงมุมหลักและองค์ประกอบด้านล่างเท่านั้น:
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ที่สูงบ่งบอกถึงการมีอยู่ของความสัมพันธ์ระหว่างกันเช่น การเชื่อมต่อเชิงเส้นระหว่างตัวแปรอธิบายสองตัว ยิ่งค่าสูงเท่าใดความสัมพันธ์ระหว่างกันก็จะยิ่งสูงขึ้น เนื่องจากเมื่อสร้างแบบจำลองจึงแทบจะเป็นไปไม่ได้เลยที่จะหลีกเลี่ยงการขาดความสัมพันธ์ระหว่างตัวแปรอธิบาย คำแนะนำถัดไปเกี่ยวกับการรวมตัวแปรสองตัวในแบบจำลองเพื่ออธิบาย สามารถรวมตัวแปรทั้งสองไว้ในโมเดลได้หากตรงต่อความสัมพันธ์
เหล่านั้น. ความใกล้ชิดของการเชื่อมต่อระหว่างตัวแปรผลลัพธ์และตัวแปรอธิบายมากกว่าความใกล้ชิดของการเชื่อมต่อระหว่างตัวแปรอธิบาย
การมีอยู่ของ multicollinearity สามารถยืนยันได้โดยการค้นหาดีเทอร์มิแนนต์ของเมทริกซ์ (2.58) หากไม่มีการเชื่อมต่อระหว่างตัวแปรอิสระอย่างสมบูรณ์ องค์ประกอบที่ไม่ใช่เส้นทแยงมุมจะเท่ากับศูนย์ และดีเทอร์มิแนนต์ของเมทริกซ์จะเท่ากับหนึ่ง หากความสัมพันธ์ระหว่างตัวแปรอิสระใกล้เคียงกับฟังก์ชัน (เช่น ใกล้มาก) ดีเทอร์มิแนนต์ของเมทริกซ์ rxg จะใกล้เคียงกับศูนย์
อีกวิธีหนึ่งในการวัดความเป็นหลายเส้นตรงเป็นผลมาจากการวิเคราะห์สูตรสำหรับความคลาดเคลื่อนมาตรฐานของสัมประสิทธิ์การถดถอย (2.28):
จากสูตรนี้ ค่าคลาดเคลื่อนมาตรฐานจะมากขึ้น ค่าที่เรียกก็จะยิ่งน้อยลงเท่านั้น ปัจจัยเงินเฟ้อแปรปรวน (หรือปัจจัยเงินเฟ้อการกระจายตัว ) วีไอเอฟ:
โดยที่ค่าสัมประสิทธิ์การกำหนดพบสำหรับสมการการพึ่งพาของตัวแปร เอ็กซ์จจากตัวแปรอื่นๆ ที่รวมอยู่ในแบบจำลองการถดถอยพหุคูณที่กำลังพิจารณา
เนื่องจากค่าสะท้อนถึงความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปร เอ็กซ์จและตัวแปรอธิบายอื่น ๆ แล้วมันจะแสดงลักษณะเฉพาะของพหุคอลลิเนียร์ที่สัมพันธ์กับตัวแปรนี้โดยพื้นฐานแล้ว เอ็กซ์จ.หากไม่มีการเชื่อมต่อ ไฟแสดงสถานะ วีไอเอฟ X จะเท่ากับ (หรือปิด) ต่อหนึ่ง การเสริมความแข็งแกร่งของการเชื่อมต่อนำไปสู่แนวโน้มของตัวบ่งชี้นี้เป็นอนันต์ พวกเขาคิดว่าถ้า วีไอเอฟ X >3 สำหรับแต่ละตัวแปร * จากนั้น multicollinearity จะเกิดขึ้น
เครื่องวัดหลายเส้นก็เรียกอีกอย่างว่า ตัวบ่งชี้ (จำนวน) ของเงื่อนไข เมทริกซ์ เท่ากับอัตราส่วนของค่าลักษณะเฉพาะสูงสุดและต่ำสุดของเมทริกซ์นี้:
เชื่อกันว่าหากลำดับของอัตราส่วนนี้เกิน 10s–106 จะเกิด multicollinearity ที่รุนแรงขึ้น
ลองตรวจสอบการมีอยู่ของ multicollinearity ในตัวอย่างที่ 2.1 ที่เรากำลังพิจารณาอยู่ เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์คู่มีรูปแบบ
สังเกตได้ว่าการเชื่อมต่อระหว่างตัวแปรอธิบายค่อนข้างใกล้กัน โดยเฉพาะระหว่างตัวแปร Xj และ x2; X] และ x3 ซึ่งแสดงถึงความสัมพันธ์ระหว่างตัวแปรเหล่านี้ มากกว่า การเชื่อมต่อที่อ่อนแอสังเกตได้ระหว่างตัวแปร x2 และ x3 มาหาดีเทอร์มิแนนต์ของเมทริกซ์ r^..
ค่าผลลัพธ์จะอยู่ใกล้กับศูนย์มากกว่าค่าหนึ่ง ซึ่งบ่งชี้ถึงการมีอยู่ของมัลติคอลลิเนียร์ในตัวแปรอธิบาย
ลองตรวจสอบความถูกต้องของการรวมตัวแปรอิสระทั้งสามตัวในแบบจำลองการถดถอยโดยใช้กฎ (2.59) ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ของตัวแปรตามและตัวแปรอิสระมีค่าเท่ากัน
ค่าเหล่านี้มีค่ามากกว่าตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรอิสระ ดังนั้นกฎ (2.59) จึงเป็นที่พอใจ โดยสามารถรวมตัวแปรทั้งสามตัวไว้ในแบบจำลองการถดถอยได้
มาวัดระดับของตัวแปรหลายเส้นตรงของตัวแปรโดยใช้ปัจจัยอัตราเงินเฟ้อแปรปรวน ( วีไอเอฟ- ในการทำเช่นนี้จำเป็นต้องคำนวณค่าสัมประสิทธิ์การพิจารณาการถดถอย:
ในการดำเนินการนี้ จำเป็นต้องใช้ OLS กับการถดถอยแต่ละครั้ง ประมาณค่าพารามิเตอร์ และคำนวณค่าสัมประสิทธิ์การกำหนด สำหรับตัวอย่างของเรา ผลการคำนวณจะเป็นดังนี้:
ดังนั้น ค่าความแปรปรวนของปัจจัยเงินเฟ้อสำหรับตัวแปรอิสระแต่ละตัวจะเท่ากับ
ค่าที่คำนวณได้ทั้งหมดไม่เกิน ค่าวิกฤตเท่ากับสาม ดังนั้น เมื่อสร้างแบบจำลอง การมีอยู่ของความสัมพันธ์ระหว่างตัวแปรอิสระสามารถละเลยได้
ในการค้นหาค่าลักษณะเฉพาะของเมทริกซ์ (เพื่อคำนวณดัชนีสภาพเงื่อนไขη (2.60)) จำเป็นต้องค้นหาวิธีแก้สมการคุณลักษณะ
เมทริกซ์สำหรับตัวอย่างของเราดูเหมือน
และเมทริกซ์ที่โมดูลัสของดีเทอร์มิแนนต์ต้องเท่ากับศูนย์จะเป็นดังนี้
พหุนามลักษณะเฉพาะใน ในกรณีนี้จะมีระดับที่สี่ซึ่งทำให้ยากต่อการแก้ไขปัญหาด้วยตนเอง ในกรณีนี้ ขอแนะนำให้ใช้ประโยชน์จากความเป็นไปได้ต่างๆ เทคโนโลยีคอมพิวเตอร์- เช่น ในพรรคพลังประชาชน อีวิวส์ได้รับค่าลักษณะเฉพาะของเมทริกซ์ดังต่อไปนี้:
ดังนั้นดัชนีเงื่อนไข η จะเท่ากับ
ซึ่งบ่งบอกถึงการมีอยู่ของ multicollinearity ที่แข็งแกร่งในโมเดล
วิธีการกำจัด multicollinearity มีดังนี้
- 1. การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรที่รวมอยู่ในแบบจำลองการถดถอยเป็นแบบอธิบาย (อิสระ) โดยมีจุดประสงค์เพื่อเลือกเฉพาะตัวแปรที่มีความเกี่ยวข้องกันเพียงเล็กน้อยเท่านั้น
- 2. การแปลงฟังก์ชันของตัวแปรที่เกี่ยวข้องอย่างใกล้ชิด ตัวอย่างเช่น เราถือว่ารายได้ภาษีในเมืองขึ้นอยู่กับจำนวนผู้อยู่อาศัยและพื้นที่ของเมือง แน่นอนว่าตัวแปรเหล่านี้จะเกี่ยวข้องกันอย่างใกล้ชิด พวกเขาสามารถถูกแทนที่ด้วยตัวแปรสัมพัทธ์ตัวเดียว "ความหนาแน่นของประชากร"
- 3. หากไม่สามารถเปลี่ยนแปลงรายการตัวแปรอิสระได้ด้วยเหตุผลบางประการคุณสามารถใช้ได้ วิธีการพิเศษการปรับแบบจำลองเพื่อขจัดความเป็นหลายโคลิเนียร์: การถดถอยแบบสัน (การถดถอยแบบสัน) วิธีส่วนประกอบหลัก
แอปพลิเคชัน การถดถอยสันเขาเกี่ยวข้องกับการปรับองค์ประกอบของเส้นทแยงมุมหลักของเมทริกซ์ด้วยค่าบวกที่ระบุโดยพลการ τ ขอแนะนำให้ใช้ค่าตั้งแต่ 0.1 ถึง 0.4 N. Draper, G. Smith ในงานของพวกเขานำเสนอหนึ่งในวิธีการสำหรับการเลือกค่า τ แบบ "อัตโนมัติ" ซึ่งเสนอโดย Hoerl, Kennard และ Beldwin:
(2.61)
ที่ไหน ต– จำนวนพารามิเตอร์ (ไม่รวมคำศัพท์อิสระ) ในแบบจำลองการถดถอยดั้งเดิม เอสเอส e – ผลรวมที่เหลือของกำลังสองที่ได้จากแบบจำลองการถดถอยดั้งเดิมโดยไม่มีการปรับเปลี่ยนสำหรับพหุคอลลิเนียร์ ก– เวกเตอร์คอลัมน์ของสัมประสิทธิ์การถดถอยที่ถูกแปลงโดยสูตร
(2.62)
ที่ไหน ซีจ– พารามิเตอร์สำหรับตัวแปร y ในแบบจำลองการถดถอยดั้งเดิม
หลังจากเลือกค่า τ แล้ว สูตรในการประมาณค่าพารามิเตอร์การถดถอยจะมีรูปแบบ
(2.63)
ที่ไหน ฉัน – เมทริกซ์เอกลักษณ์; เอ็กซ์,– เมทริกซ์ของค่าของตัวแปรอิสระ: ดั้งเดิมหรือแปลงตามสูตร (2.64) Υ τ เป็นเวกเตอร์ของค่าของตัวแปรตาม: ดั้งเดิมหรือแปลงตามสูตร (2.65)
(2.64)
และตัวแปรผลลัพธ์
ในกรณีนี้ หลังจากประมาณค่าพารามิเตอร์โดยใช้สูตร (2.63) แล้ว จำเป็นต้องดำเนินการถดถอยกับตัวแปรเดิมต่อไปโดยใช้ความสัมพันธ์
การประมาณค่าพารามิเตอร์การถดถอยที่ได้จากสูตร (2.63) จะมีอคติ อย่างไรก็ตาม เนื่องจากดีเทอร์มิแนนต์ของเมทริกซ์มีค่ามากกว่าดีเทอร์มิแนนต์ของเมทริกซ์ ความแปรปรวนของการประมาณพารามิเตอร์การถดถอยจะลดลง ซึ่งจะส่งผลเชิงบวกต่อคุณสมบัติการทำนายของแบบจำลอง
ลองพิจารณาการใช้การถดถอยแบบสันตามตัวอย่าง 2.1 ลองหาค่าของ τ โดยใช้สูตร (2.61) ในการทำเช่นนี้ อันดับแรกเราคำนวณเวกเตอร์ของสัมประสิทธิ์การถดถอยที่แปลงแล้วโดยใช้สูตร (2.62):
สินค้าคือ 1.737-109. ดังนั้น τ ที่แนะนำจะเป็น
หลังจากใช้สูตร (2.63) และการแปลงตามสูตร (2.66) เราจะได้สมการการถดถอย
แอปพลิเคชัน การวิเคราะห์องค์ประกอบหลัก เกี่ยวข้องกับการเปลี่ยนจากตัวแปรที่ขึ้นอยู่กับตัวแปร x ไปเป็นตัวแปร ζ ที่เป็นอิสระจากกัน ซึ่งเรียกว่า หลัก
ส่วนประกอบ. แต่ละองค์ประกอบหลัก z สามารถแสดงเป็น การรวมกันเชิงเส้นตัวแปรอธิบายแบบกึ่งกลาง (หรือแบบมาตรฐาน) ที:.จำได้ว่าการทำให้ตัวแปรอยู่ตรงกลางเกี่ยวข้องกับการลบค่า i-th แต่ละค่าของค่าที่กำหนด เจ-ธตัวแปรของค่าเฉลี่ย:
และการกำหนดมาตรฐาน (scaling) คือการหารนิพจน์ (2.67) โดยค่าเบี่ยงเบนมาตรฐานที่คำนวณสำหรับค่าเริ่มต้นของตัวแปร Xj
เนื่องจากตัวแปรอิสระมักจะมี ขนาดที่แตกต่างกันการวัดสูตร (2.68) ถือว่าเหมาะกว่า
จำนวนส่วนประกอบอาจน้อยกว่าหรือเท่ากับจำนวนตัวแปรอิสระดั้งเดิม ร.หมายเลขส่วนประกอบ ถึงสามารถเขียนได้ดังนี้:
(2.69)
แสดงให้เห็นว่าค่าประมาณในสูตร (2.69) สอดคล้องกับองค์ประกอบต่างๆ ถึง-เวกเตอร์ลักษณะเฉพาะของเมทริกซ์ โดยที่ ต– เมทริกซ์ขนาดที่มีตัวแปรมาตรฐาน การกำหนดหมายเลขของส่วนประกอบหลักไม่ได้เป็นไปตามอำเภอใจ องค์ประกอบหลักประการแรกมีความแปรปรวนสูงสุด ซึ่งสอดคล้องกับค่าลักษณะเฉพาะสูงสุดของเมทริกซ์ อย่างหลังคือความแปรปรวนขั้นต่ำและค่าลักษณะเฉพาะที่น้อยที่สุด
ส่วนแบ่งผลต่าง ถึง-ส่วนประกอบของความแปรปรวนรวมของตัวแปรอิสระคำนวณโดยใช้สูตร
ที่ไหน เอ็กซ์ k คือค่าลักษณะเฉพาะที่สอดคล้องกับองค์ประกอบนี้ ตัวหารของสูตร (2.70) มีผลรวมของค่าลักษณะเฉพาะทั้งหมดของเมทริกซ์
หลังจากคำนวณค่าของส่วนประกอบ z แล้ว การถดถอยจะถูกสร้างขึ้นโดยใช้ OLS ขอแนะนำให้จัดกึ่งกลาง (กำหนดมาตรฐาน) ตัวแปรตามในการถดถอยองค์ประกอบหลัก (2.71) โดยใช้สูตร (2.67) หรือ (2.68)
ที่ไหน ที y – ตัวแปรตามที่เป็นมาตรฐาน (ศูนย์กลาง) – ค่าสัมประสิทธิ์การถดถอยสำหรับองค์ประกอบหลัก – ส่วนประกอบหลัก เรียงลำดับตามค่าลักษณะเฉพาะจากมากไปหาน้อย เอ็กซ์ถึง ; δ – ส่วนที่เหลือแบบสุ่ม
หลังจากประมาณค่าพารามิเตอร์การถดถอย (2.71) แล้ว คุณสามารถดำเนินการสมการการถดถอยในตัวแปรเดิมได้โดยใช้นิพจน์ (2.67)–(2.69)
ลองพิจารณาการประยุกต์ใช้วิธีส่วนประกอบหลักกับข้อมูลของตัวอย่างที่ 2.1 โปรดทราบว่าเมทริกซ์สำหรับตัวแปรมาตรฐานในขณะเดียวกันก็เป็นเมทริกซ์ของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ระหว่างตัวแปรอิสระ มีการคำนวณไว้แล้วและเท่ากัน
มาหาค่าลักษณะเฉพาะและเวกเตอร์ลักษณะเฉพาะของเมทริกซ์นี้โดยใช้ PPP รีวิว.เราได้รับผลลัพธ์ดังต่อไปนี้
ค่าลักษณะเฉพาะของเมทริกซ์:
ส่วนแบ่งของความแปรปรวนของตัวแปรอิสระที่สะท้อนโดยองค์ประกอบคือ
ลองรวมเวกเตอร์ลักษณะเฉพาะของเมทริกซ์เข้าด้วยกัน โดยเขียนเป็นคอลัมน์ของเมทริกซ์ด้านล่างนี้ เอฟโดยเรียงลำดับจากมากไปหาน้อยตามค่าลักษณะเฉพาะ เช่น คอลัมน์แรกคือเวกเตอร์ลักษณะเฉพาะของค่าสูงสุด หมายเลขของตัวเองฯลฯ :
ดังนั้นองค์ประกอบ 3 ประการ (ตรงกับ 3 ประการ) เวกเตอร์ลักษณะเฉพาะ) สามารถเขียนได้ในรูป
หลังจากกำหนดมาตรฐานตัวแปรเริ่มต้นตามสูตร (2.68) และคำนวณค่าของส่วนประกอบ (ค่า n ของแต่ละองค์ประกอบ) โดยใช้กำลังสองน้อยที่สุด เราจะพบพารามิเตอร์ของสมการ (2.71):
ในผลลัพธ์สมการถดถอย เฉพาะพารามิเตอร์ที่องค์ประกอบแรกเท่านั้นที่มีนัยสำคัญ นี่เป็นผลตามธรรมชาติโดยคำนึงถึงข้อเท็จจริงที่ว่า ส่วนประกอบนี้อธิบายความแปรผันของตัวแปรอิสระได้ 70.8% เนื่องจากส่วนประกอบต่างๆ มีความเป็นอิสระ เมื่อส่วนประกอบบางอย่างถูกแยกออกจากโมเดล พารามิเตอร์ของสมการสำหรับส่วนประกอบอื่นๆ จึงไม่เปลี่ยนแปลง ดังนั้นเราจึงมีสมการการถดถอยที่มีองค์ประกอบเดียว:
ลองแปลงนิพจน์ผลลัพธ์เป็นการถดถอยด้วยตัวแปรดั้งเดิม
ดังนั้นเราจึงได้สมการถดถอยโดยใช้วิธีองค์ประกอบหลัก
การกำจัด multicollinearity โดยใช้การถดถอยแบบสันและวิธีการองค์ประกอบหลักทำให้เกิดการเปลี่ยนแปลงบางอย่างในพารามิเตอร์ของการถดถอยดั้งเดิมซึ่งมีรูปแบบ
โปรดทราบว่าการเปลี่ยนแปลงเหล่านี้มีขนาดค่อนข้างเล็ก ซึ่งบ่งชี้ถึงระดับของเส้นตรงหลายเส้นที่ต่ำ
- ดูตัวอย่าง วุชคอฟ ไอ., โบยาดซิเอวา แอล., โซลาคอฟ อี.สมัครแล้ว การวิเคราะห์การถดถอย: ต่อ. จากบัลแกเรีย อ.: การเงินและสถิติ, 2530 หน้า 110.
- เดรเปอร์ เอ็น., สมิธ จี.พระราชกฤษฎีกา ปฏิบัติการ ป.514.
ที.จี. เทิร์นอีฟ
ปฏิบัติการเศรษฐมิติ
โมเดลเชิงเส้นของการถดถอยแบบคู่
เศรษฐมิติเป็นวิทยาศาสตร์ที่ศึกษาความสัมพันธ์เชิงปริมาณและคุณภาพเฉพาะระหว่างวัตถุและกระบวนการทางเศรษฐกิจโดยใช้วิธีการและแบบจำลองทางคณิตศาสตร์และสถิติ (พจนานุกรมสารานุกรมใหญ่ - M., BRE, 1977)
วิธีแรกคือวิธีทางเศรษฐมิติเป็นวิธีการวิเคราะห์ทางสถิติของข้อมูลทางเศรษฐกิจที่เฉพาะเจาะจง
การประเมินผลการสร้างแบบจำลองทางเศรษฐมิติสามารถทำได้โดยการแก้ปัญหาเชิงคุณภาพและเชิงปริมาณ องค์ประกอบเชิงคุณภาพคือการสร้างความสอดคล้องระหว่างแบบจำลองที่สร้างขึ้นกับแนวคิดเศรษฐศาสตร์พื้นฐาน และองค์ประกอบเชิงปริมาณคือการประมาณข้อมูลที่มีอยู่ด้วยข้อมูลการคำนวณอย่างแม่นยำ
จากมุมมองเชิงปฏิบัติ งานหลักของเศรษฐมิติ ได้แก่ :
การสร้างแบบจำลองทางเศรษฐมิติ – การนำเสนอแบบจำลองทางเศรษฐศาสตร์ในรูปแบบทางคณิตศาสตร์ที่สะดวกสำหรับการวิเคราะห์เชิงประจักษ์ ปัญหานี้เรียกว่าปัญหาสเปคที่สามารถแก้ไขได้หลายวิธี
การประเมินพารามิเตอร์ของแบบจำลองที่สร้างขึ้นซึ่งช่วยให้เราสามารถระบุลักษณะความเพียงพอของแบบจำลองด้วยข้อมูลจริง งานที่ระบุได้รับการแก้ไขในขั้นตอนการกำหนดพารามิเตอร์
ตรวจสอบคุณภาพของโมเดลผลลัพธ์โดยรวม งานนี้นำไปใช้ในขั้นตอนการตรวจสอบ
การใช้แบบจำลองที่สร้างขึ้นเพื่อการพยากรณ์
แบบจำลองการถดถอยเชิงเส้นแบบคู่เป็นกรณีพิเศษของแบบจำลองการถดถอยหลายตัวแปร การศึกษานี้เป็นที่สนใจโดยอิสระ เนื่องจากมีคุณสมบัติเฉพาะหลายประการของแบบจำลองหลายมิติทั่วไป แต่มีการมองเห็นมากกว่าและง่ายต่อการศึกษา
งานคำนวณและกราฟิกทางเศรษฐมิติ
แบบจำลองการถดถอยเชิงเส้นคู่
สร้างเขตข้อมูลสหสัมพันธ์และกำหนดสมมติฐานเกี่ยวกับรูปแบบของการเชื่อมต่อ
ให้มีข้อมูลเชิงประจักษ์สองชุด เอ็กซ์ (x 1 , x 2 , …, x n ) และ ย (ย 1 , ย 2 , …, ย n ) จุดสอดคล้องกับพิกัด (x ฉัน , ย ฉัน ), ที่ไหน ฉัน=1,2,…, n, แสดงผลบนระนาบพิกัด ภาพนี้มีชื่อว่า สนามความสัมพันธ์- ให้เราสมมติจากตำแหน่งของจุดเชิงประจักษ์ว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปร เอ็กซ์ และ ย.
โดยทั่วไปแล้ว ตัวแบบการถดถอยคู่เชิงเส้นเชิงทฤษฎีสามารถแสดงเป็น:
ย=
หรือ ย ฉัน =
,
ฉัน=1,2,…,
n;
ที่ไหน ย– ตัวแปรอธิบาย (ผลลัพธ์, ขึ้นอยู่กับ, ภายนอก)
เอ็กซ์ -ตัวแปรหรือตัวถดถอยเชิงอธิบาย (แฟกทอเรียล, อิสระ, ภายนอก)
- พารามิเตอร์ทางทฤษฎี (สัมประสิทธิ์ตัวเลข) ของการถดถอยที่จะประมาณ
ε ฉัน- การเบี่ยงเบนแบบสุ่ม (การรบกวน, ข้อผิดพลาด)
สมมติฐานหลัก:
3ก. ม ε ฉัน =0, ฉัน=1,2,…, n.
3บี ดี ε ฉัน= σ 2, ฉัน=1,2,…, n. เรียกว่าเงื่อนไขสำหรับความแปรปรวนของข้อผิดพลาดที่ไม่ขึ้นอยู่กับจำนวนการสังเกต การรักร่วมเพศ- กรณีที่สภาวะโฮโมสเคดาติสติกไม่เป็นที่พอใจเรียกว่า ความไม่สมดุล
3 วินาที ม( ε ฉัน ε เจ )=0 ณ ฉัน ≠ เจ ข้อผิดพลาดที่ไม่สัมพันธ์กันสำหรับการสังเกตที่แตกต่างกัน หากไม่ตรงตามเงื่อนไขนี้ พูดคุยเกี่ยวกับ ความสัมพันธ์อัตโนมัติข้อผิดพลาด
ปกติจะกระจายการรบกวน ตัวแปรสุ่ม: ε ฉัน ≈ เอ็น(0, σ 2 ).
ความคิดเห็นเพื่อให้ได้สมการการถดถอย สามหลักแรกก็เพียงพอแล้ว เพื่อประเมินความถูกต้องของสมการการถดถอยและพารามิเตอร์ต่างๆ จะต้องเป็นไปตามข้อกำหนดเบื้องต้นที่สี่
หน้าที่ของการวิเคราะห์การถดถอยเชิงเส้นคือการใช้ข้อมูลทางสถิติที่มีอยู่ (x ฉัน , ย ฉัน ), ฉัน=1,2,…, nสำหรับตัวแปร X และ Y ให้หาค่าประมาณที่ดีที่สุดของพารามิเตอร์ที่ไม่รู้จัก เช่น สร้างสิ่งที่เรียกว่า สมการถดถอยเชิงประจักษ์
ที่ไหน
การประมาณค่าความคาดหวังทางคณิตศาสตร์แบบมีเงื่อนไข M(Y/ X=x i);
การประมาณค่าพารามิเตอร์ที่ไม่รู้จักเรียกว่า ค่าสัมประสิทธิ์เชิงประจักษ์ การถดถอยในแต่ละกรณีเราสามารถเขียนได้
, ฉัน=1,2,…, n,
ส่วนเบี่ยงเบนอยู่ที่ไหน จ ฉัน– ข้อผิดพลาด (ตกค้าง) ของแบบจำลองซึ่งเป็นการประมาณค่าความเบี่ยงเบนสุ่มทางทฤษฎี ε ฉัน .
2. คำนวณพารามิเตอร์ของสมการการถดถอยเชิงเส้นตัวอย่างโดยใช้วิธีกำลังสองน้อยที่สุด (OLS)
แนวทางคลาสสิกในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นใช้วิธีกำลังสองน้อยที่สุด (OLS) ในวิธีกำลังสองน้อยที่สุด การประมาณค่าพารามิเตอร์แบบจำลองจะถูกสร้างขึ้นเพื่อลดผลรวมของข้อผิดพลาดของแบบจำลองกำลังสองน้อยที่สุดจากการสังเกตทั้งหมด ดังนั้น เกณฑ์กำลังสองน้อยที่สุดจึงเขียนได้ดังนี้
เงื่อนไขที่จำเป็นสำหรับการมีอยู่ของฟังก์ชันขั้นต่ำ ส(ข 0 , ข 1 ) คือความเสมอภาคกับศูนย์ของอนุพันธ์ย่อยเทียบกับสิ่งที่ไม่รู้ ข 0 และ ข 1 (เพื่อความกระชับ เราจะละเว้นดัชนีผลรวมที่เครื่องหมายผลรวม Σ):
ระบบสมการนี้เรียกว่า ระบบสมการปกติสำหรับค่าสัมประสิทธิ์การถดถอย
การแก้ระบบสมการเชิงเส้นสองสมการนี้โดยไม่ทราบค่าสองตัว เช่น โดยวิธีการทดแทน เราได้รับ:
ที่ไหน
ค่าเฉลี่ยตัวอย่างของตัวแปร X และ Y
.
จากมุมมองทางเรขาคณิต การลดผลรวมของการเบี่ยงเบนกำลังสองให้เหลือน้อยที่สุดหมายถึงการเลือกเส้นตรงเส้นเดียว (ของเส้นตรงทั้งหมดที่มีพารามิเตอร์) ที่อยู่ใกล้กับระบบจุดตัวอย่างมากที่สุด (x ฉัน , ย ฉัน ), ฉัน=1,2,…, n.
สมการถดถอยจะเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อเสมอ เมื่อใช้การถดถอยเชิงเส้น ตัวบ่งชี้นี้คือ สัมประสิทธิ์สหสัมพันธ์เชิงเส้น ร เอ็กซ์ซี- สูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้นมีหลายประเภท สูตรหลัก:
.
ความสัมพันธ์ระหว่างตัวแปรเรียกว่า direct if ร เอ็กซ์ซี . >0, และการสนทนาว่าถ้า ร เอ็กซ์ซี
สำหรับการคำนวณเชิงปฏิบัติ สูตรที่สะดวกที่สุดคือ
,
เนื่องจากตามนั้นจึงพบค่าสัมประสิทธิ์สหสัมพันธ์ได้จากข้อมูลเชิงสังเกตและค่า ร เอ็กซ์ซีข้อผิดพลาดในการปัดเศษจะไม่ได้รับผลกระทบ
ค่าสัมประสิทธิ์สหสัมพันธ์รับค่าตั้งแต่ -1 ถึง +1
เมื่อค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ การเชื่อมต่อ 1 รายการแสดงด้วยการพึ่งพาฟังก์ชันเชิงเส้น ในกรณีนี้ค่าที่สังเกตได้ทั้งหมดจะอยู่บนเส้นถดถอย
ที่ ร เอ็กซ์ซี=0 ความสัมพันธ์ระหว่างลักษณะต่างๆ ใน รูปแบบเชิงเส้นไม่มา. ในกรณีนี้ เส้นการถดถอยจะขนานกับแกน Ox
ที่ ร เอ็กซ์ซี > 0 – ความสัมพันธ์ระหว่างตัวแปรเรียกว่าโดยตรง และเมื่อใด ร เอ็กซ์ซี
คุณสามารถใช้มาตราส่วนเพื่อระบุลักษณะความแข็งแกร่งของการเชื่อมต่อ ชาดก.
ดัชนี ความรัดกุมของการสื่อสาร |
|||||
ลักษณะเฉพาะ ความแรงของการเชื่อมต่อ |
ปานกลาง |
สังเกตเห็นได้ชัดเจน |
สูงมาก |
ในการประเมินคุณภาพของการปรับฟังก์ชันเชิงเส้น ให้คำนวณกำลังสองของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น ร เอ็กซ์ซี 2 , เรียกว่า ค่าสัมประสิทธิ์การตัดสินใจ.เราแสดงถึงค่าสัมประสิทธิ์การตัดสินใจ ร 2 , ที่. เรามี
ร 2 = ร เอ็กซ์ซี 2 .
ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของคุณลักษณะที่มีประสิทธิผล Y อธิบายโดยการถดถอยของความแปรปรวนรวมของคุณลักษณะที่มีประสิทธิผล ตามมูลค่า 1- ร 2 ระบุลักษณะสัดส่วนของความแปรปรวนใน Y ที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้คำนึงถึงในแบบจำลอง
ความคิดเห็นการคำนวณ ร 2 ถูกต้องหากรวมค่าคงที่ไว้ในสมการการถดถอย
สมการการถดถอยเชิงประจักษ์ถูกกำหนดโดยอาศัยสถิติจำนวนจำกัด แน่นอนว่าค่าสัมประสิทธิ์ของสมการการถดถอยเชิงประจักษ์เป็นตัวแปรสุ่มที่แตกต่างกันไปในแต่ละตัวอย่าง เมื่อดำเนินการ การวิเคราะห์ทางสถิติไม่จำเป็นต้องเปรียบเทียบสัมประสิทธิ์การถดถอยเชิงประจักษ์ ข 0
และ ข 1
ด้วยค่าคาดหวังทางทฤษฎีบางประการ
ค่าสัมประสิทธิ์เหล่านี้ การวิเคราะห์นี้ดำเนินการตามแผนการทดสอบสมมติฐานทางสถิติ
เพื่อทดสอบสมมติฐาน
ฮ 0: ข 1 = β 1 ,
ฮ 1: ข 1 ≠ β 1
มีการใช้สถิติ
ซึ่งหากสมมติฐาน H 0 เป็นจริง จะมีการกระจายตัวของนักเรียนด้วยจำนวนดีกรีอิสระ df
= n
– 2
, ที่ไหน
- ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย
ข 1
,
.
สิ่งที่สำคัญที่สุดในระยะเริ่มต้นของการวิเคราะห์ทางสถิติของแบบจำลองที่สร้างขึ้นคืองานในการสร้างสถานะ การพึ่งพาเชิงเส้นระหว่าง Y และ X ปัญหานี้สามารถแก้ไขได้โดยการทดสอบสมมติฐาน
ฮ 0: ข 1 = 0,
ฮ 1: ข 1 ≠ 0.
สมมติฐานในสูตรนี้มักเรียกว่า สมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอยยิ่งไปกว่านั้น หากยอมรับสมมติฐานว่าง ก็มีเหตุผลให้เชื่อว่าค่าของ Y ไม่ได้ขึ้นอยู่กับสัมประสิทธิ์ X ข 1
ไม่มีนัยสำคัญทางสถิติ(มันใกล้กับศูนย์มากเกินไป) หากค่าเบี่ยงเบน H เป็น 0 จะพิจารณาค่าสัมประสิทธิ์ มีนัยสำคัญทางสถิติซึ่งบ่งชี้ว่ามีความสัมพันธ์เชิงเส้นตรงระหว่าง Y และ X ใช้ในกรณีนี้ ที– สถิติมีรูปแบบ:
และภายใต้สมมติฐานว่างมีการแจกแจงของนักเรียนด้วย ( n
-2)
ระดับความอิสระ.
หากคำนวณค่าแล้ว ที– สถิติ- |ที ความจริง| α มากกว่าวิกฤต (ตาราง) เสื้อ โต๊ะ, เช่น.
|ที ความจริง|> เสื้อ โต๊ะ= ที(α ; n-2),
จากนั้นสมมติฐาน H 0: ข 1 = 0, ถูกปฏิเสธเพื่อเป็นทางเลือกในระดับนัยสำคัญที่เลือก สิ่งนี้เป็นการยืนยันนัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย ข 1 .
ถ้า |t ความจริง| ตาราง = ที(α; n-2), ดังนั้นสมมติฐาน H 0 จะไม่ถูกปฏิเสธ ค่าวิกฤต เสื้อ โต๊ะ= ที(α; n-2), α และจำนวนระดับความเป็นอิสระ n -2 พบได้ในตารางที่ 2 ของภาคผนวก
ตามรูปแบบที่คล้ายกันบนพื้นฐานของ ที– สถิติทดสอบสมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์ ข 0 :
,
ที่ไหน
และ
-
ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยข 0
.
สร้างการประมาณช่วงเวลาของพารามิเตอร์การถดถอย ตรวจสอบว่าผลลัพธ์ที่ได้สอดคล้องกับข้อสรุปที่ได้รับในย่อหน้าก่อนหน้าหรือไม่
สูตรคำนวณช่วงความเชื่อมั่นมีดังนี้
ซึ่งเชื่อถือได้ (1 – แอลฟา)ครอบคลุมพารามิเตอร์ที่กำหนด
ถ้าศูนย์อยู่ภายในขอบเขตของช่วงความเชื่อมั่น เช่น หากขีดจำกัดล่างเป็นลบและขีดจำกัดบนเป็นบวก พารามิเตอร์ที่ประมาณไว้จะถือว่าไม่มีนัยสำคัญทางสถิติ
สร้างตารางการวิเคราะห์ความแปรปรวนเพื่อประเมินความสำคัญของสมการโดยรวม
ตรวจสอบ ความสำคัญของสมการถดถอย- หมายถึงการกำหนดว่าแบบจำลองทางคณิตศาสตร์ที่แสดงความสัมพันธ์ระหว่างตัวแปรเหมาะสมกับข้อมูลที่มีอยู่หรือไม่ และตัวแปรอธิบายที่รวมอยู่ในสมการนั้นเพียงพอที่จะอธิบายตัวแปรตามหรือไม่
นัยสำคัญของสมการโดยรวมได้รับการประเมินโดยใช้ เอฟ– เกณฑ์ฟิชเชอร์ในกรณีนี้ มีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ นั่นคือ ฮ0: β 1 =0, ดังนั้นปัจจัยจึงไม่มีอิทธิพลต่อผลลัพธ์
ชำระเงินโดยตรง เอฟ– เกณฑ์นำหน้าด้วยการวิเคราะห์การกระจายตัวของลักษณะผลลัพธ์ Y จุดศูนย์กลางในนั้นถูกครอบครองโดยการสลายตัวของผลรวมของการเบี่ยงเบนกำลังสองของตัวแปร y จากค่าเฉลี่ย ออกเป็นสองส่วน - “อธิบาย” และ “ตกค้าง” (“ไม่ได้อธิบาย”):
=
+
ผลรวมของกำลังสอง ผลรวมของกำลังสอง ผลรวมที่เหลือ
ส่วนเบี่ยงเบน = ส่วนเบี่ยงเบนที่อธิบาย + กำลังสอง
การถดถอยของการเบี่ยงเบน
ให้เราแสดงว่า SS ทั้งหมด =, SS R =
และ SS ost =
.
ผลรวมของการเบี่ยงเบนกำลังสองสัมพันธ์กับจำนวนดีกรีอิสระ df (ระดับ ของ เสรีภาพ), เช่น. ด้วยจำนวนอิสระของการแปรผันของคุณลักษณะอย่างอิสระ
จำนวนองศาอิสระสัมพันธ์กับจำนวนหน่วยประชากร nและด้วยจำนวนค่าคงที่ที่กำหนดจากมัน จำนวนองศาอิสระของผลรวมที่เหลือของกำลังสองในการถดถอยเชิงเส้นคู่คือ n - 2 , ผลรวมของกำลังสอง – n -1 และจำนวนดีกรีอิสระสำหรับผลรวมตัวประกอบของกำลังสอง เช่น อธิบายโดยการถดถอย มีค่าเท่ากับ หน่วย- เรามีความเท่าเทียมกัน:
n – 1 = 1+ (n – 2).
เราได้หารผลรวมของกำลังสองแต่ละค่าด้วยจำนวนองศาอิสระที่สอดคล้องกัน ค่าเฉลี่ยส่วนเบี่ยงเบนกำลังสองหรือ การกระจายตัวต่อระดับความเป็นอิสระ.
;
การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและการกระจายตัวของค่าความอิสระต่อหนึ่งระดับ เราจะได้ค่าดังกล่าว เอฟ-ความสัมพันธ์หรือ เอฟ– เกณฑ์ซึ่งมีสถิติ เอฟ ภายใต้สมมติฐานว่าง
~ เอฟ(1, n-2)
เผยแพร่ตามกฎของฟิชเชอร์โดยมีระดับความเป็นอิสระ (1, n-2)
หากคำนวณค่าแล้ว เอฟ-ความสัมพันธ์ - เอฟข้อเท็จจริงในระดับความสำคัญที่กำหนด α มากกว่าวิกฤต (ตาราง) เอฟโต๊ะ, เช่น.
เอฟข้อเท็จจริง> เอฟตาราง =เอฟ(α;1,n-2),
จากนั้นสมมติฐาน H 0: β 1 =0 ถูกปฏิเสธ นัยสำคัญทางสถิติของสมการการถดถอยได้รับการยอมรับ เช่น มีความเชื่อมโยงระหว่างคุณลักษณะที่พิจารณากับผลการสังเกตไม่ขัดแย้งกับสมมติฐานความเป็นเส้นตรง
ถ้า เอฟข้อเท็จจริงเอฟ ตาราง =เอฟ(α;1,n-2), ดังนั้นสมมติฐาน H 0 จะไม่ถูกปฏิเสธ สมการการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ
ค่าวิกฤต เอฟตาราง =เอฟ(α;1,n-2), ในระดับความสำคัญที่กำหนด α และจำนวนระดับความเป็นอิสระ 1; n -2 พบได้ในตารางที่ 1 ของภาคผนวก
การประเมินความสำคัญของสมการการถดถอยมักจะได้รับในรูปแบบของตารางการวิเคราะห์ความแปรปรวน
1. สำหรับ แบบจำลองการถดถอยขึ้นอยู่กับรายได้ทางการเงินเฉลี่ยต่อหัวของประชากร (RUB, ที่) จากปริมาณผลิตภัณฑ์มวลรวมในภูมิภาค (พันรูเบิล x1) และอัตราการว่างงานในเรื่อง (%, x2) จะได้สมการ ค่าสัมประสิทธิ์การถดถอยสำหรับตัวแปร x2บ่งชี้ว่าเมื่ออัตราการว่างงานเปลี่ยนแปลง 1% รายได้เงินสดเฉลี่ยต่อหัว ______ รูเบิลโดยมีมูลค่าคงที่ของผลิตภัณฑ์มวลรวมในภูมิภาค
จะเปลี่ยนเป็น (-1.67)
จะเพิ่มขึ้น 1.67
จะลดลง (-1.67)
จะเปลี่ยนเป็น 0.003
สารละลาย:
แบบจำลองทางเศรษฐมิติ สมการเชิงเส้นการถดถอยมีรูปแบบ ที่ไหน ย– ตัวแปรตาม เอ็กซ์เจ –ตัวแปรอิสระ ( – จำนวนตัวแปรอิสระในแบบจำลอง เค– จำนวนตัวแปรอิสระทั้งหมดในแบบจำลอง) ก,บีเจ ยปัจจัยอื่นๆ ที่ไม่ใช่ตัวแปรอิสระในแบบจำลอง) ค่าสัมประสิทธิ์การถดถอยเป็นพารามิเตอร์ บีเจ- ค่าของมันแสดงให้เห็นว่าตัวแปรตามจะเปลี่ยนแปลงโดยเฉลี่ยเท่าใด ยเมื่อเปลี่ยนตัวแปรอิสระที่สอดคล้องกัน เอ็กซ์เจต่อ 1 หน่วยการวัด ดังนั้น หากอัตราการว่างงานเปลี่ยนแปลง 1% รายได้เงินสดเฉลี่ยต่อหัวจะเปลี่ยนไป (-1.67) รูเบิล โดยผลิตภัณฑ์มวลรวมในภูมิภาคยังคงไม่เปลี่ยนแปลง
2. ในสมการการถดถอยพหุคูณเชิงเส้น: ต้นทุนของสินทรัพย์ถาวรอยู่ที่ไหน (พันรูเบิล) – จำนวนพนักงาน (พันคน) ย- ปริมาณ การผลิตภาคอุตสาหกรรม(พันรูเบิล) พารามิเตอร์พร้อมตัวแปร x1เท่ากับ 10.8 หมายความว่าเมื่อปริมาณสินทรัพย์ถาวรเพิ่มขึ้น _____ ปริมาณการผลิตภาคอุตสาหกรรม _____ โดยมีจำนวนพนักงานคงที่
สำหรับ 1,000 รูเบิล ... จะเพิ่มขึ้น 10.8 พันรูเบิล
สำหรับ 1,000 รูเบิล ... จะลดลง 10.8 พันรูเบิล
สำหรับ 1,000 รูเบิล …จะเพิ่มขึ้น 10.8%
1%...เพิ่มขึ้น 10.8%
สารละลาย:
ในสมการการถดถอยเชิงเส้นพหุคูณ พารามิเตอร์จะแสดงการเปลี่ยนแปลงโดยเฉลี่ยในผลลัพธ์ ยเมื่อปัจจัยเพิ่มขึ้นหนึ่งหน่วย โดยมีเงื่อนไขว่าตัวแปรอื่นๆ ทั้งหมดคงที่ ในกรณีของเราคือปริมาณการผลิตภาคอุตสาหกรรม ยโดดเด่นด้วยสมการต่อไปนี้ พารามิเตอร์เท่ากับ 10.8 ดังนั้นเมื่อปริมาณสินทรัพย์ถาวรเพิ่มขึ้น 1,000 รูเบิล ปริมาณการผลิตภาคอุตสาหกรรมจะเพิ่มขึ้น 10.8 พันรูเบิล ด้วยจำนวนพนักงานที่สม่ำเสมอ
3. เป็นที่ทราบกันว่าส่วนแบ่งของความแปรปรวนคงเหลือของตัวแปรตามในความแปรปรวนรวมคือ 0.2 แล้วค่าสัมประสิทธิ์การตัดสินใจคือ...
สารละลาย:
ค่าสัมประสิทธิ์การตัดสินใจ เท่ากับสัดส่วนของความแปรปรวนที่อธิบายโดยการถดถอยของความแปรปรวนทั้งหมด ค่า () แสดงสัดส่วนของความแปรปรวนคงเหลือในผลรวมหรือความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้คำนึงถึงในแบบจำลอง
- วิธี,
4. แบบจำลองทางเศรษฐมิติถูกสร้างขึ้นเพื่อการพึ่งพาผลกำไรการขายหน่วยการผลิต (ถู., ที่) จากจำนวนเงินทุนหมุนเวียนขององค์กร (พันรูเบิล x1- เพราะฉะนั้น, ขนาดเฉลี่ยกำไรจากการขายซึ่งไม่ได้ขึ้นอยู่กับปริมาณเงินทุนหมุนเวียนขององค์กรคือ _____ รูเบิล
สารละลาย:
แบบจำลองทางเศรษฐมิติของสมการเชิงเส้นของการถดถอยแบบคู่มีรูปแบบ: , ที่ไหน ย– ตัวแปรตาม เอ็กซ์ –ตัวแปรอิสระ ก,ข– พารามิเตอร์สมการ – ข้อผิดพลาดของแบบจำลอง (คำนึงถึงผลกระทบต่อตัวแปรตาม ยปัจจัยอื่นๆ ที่ไม่ใช่ตัวแปรอิสระในแบบจำลอง) ค่าพารามิเตอร์ กสามารถคำนวณได้โดยใช้สูตร ถ้าอย่างนั้น ; ในกรณีนี้เขาบอกว่าเป็นค่าเฉลี่ยของตัวแปร ยโดยไม่ขึ้นกับค่าตัวแปร เอ็กซ์เท่ากับค่าพารามิเตอร์ ก- ดังนั้นกำไรเฉลี่ยจากการขายซึ่งไม่ได้ขึ้นอยู่กับปริมาณเงินทุนหมุนเวียนขององค์กรคือ 10.75 รูเบิล
5. สถิติ F คำนวณเป็นอัตราส่วนของความแปรปรวน ______ ต่อความแปรปรวน ________ โดยคำนวณตามระดับความเป็นอิสระ
แฟกทอเรียล...สารตกค้าง
คงเหลือ...แฟกทอเรียล
แฟกทอเรียล...ถึงเรื่องทั่วไป
ที่เหลือ...รวม
สารละลาย:
เอฟ-สถิติคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อหนึ่งดีกรีอิสระ ต่อความแปรปรวนคงเหลือต่อหนึ่งดีกรีอิสระ
หัวข้อที่ 5: การประมาณค่าพารามิเตอร์ของสมการการถดถอยเชิงเส้น
1. สำหรับแบบจำลองสมการถดถอยเศรษฐมิติ ข้อผิดพลาดของแบบจำลองถูกกำหนดเป็น ______ ระหว่างค่าจริงของตัวแปรตามและค่าประมาณ
ความแตกต่าง
ผลรวมของผลต่างกำลังสอง
ผลต่างกำลังสอง
ผลรวมของผลต่างของกำลังสอง
สารละลาย:
แบบจำลองทางเศรษฐมิติประเภทหนึ่งคือสมการถดถอย ซึ่งสามารถเขียนได้เป็น การแสดงออกทางคณิตศาสตร์, ที่ไหน ย– ตัวแปรตาม เอ็กซ์เจ– ตัวแปรอิสระ ( เจ= 1,…, เค; เค– จำนวนตัวแปรอิสระ) ฉ- พิมพ์ การพึ่งพาการทำงาน (ฟังก์ชันทางคณิตศาสตร์- – ปัจจัยสุ่ม ในกรณีนี้ โดยที่ คือค่าที่แท้จริงของตัวแปรตาม คือค่าที่คำนวณได้ของตัวแปรตาม และเป็นข้อผิดพลาดของโมเดล มาแสดงค่ากัน: . ดังนั้นคำตอบที่ถูกต้องคือ “ความแตกต่าง”
2.ปริมาณเรียกว่า...
องค์ประกอบแบบสุ่ม
การประมาณค่าพารามิเตอร์
ค่าพารามิเตอร์
ตัวแปร
สารละลาย:
ปริมาณนี้เรียกว่าองค์ประกอบสุ่มหรือการรบกวน และรวมถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง ข้อผิดพลาดในการสุ่มตัวอย่าง และข้อผิดพลาดในการวัด
3. ในแบบจำลองเศรษฐมิติของสมการการถดถอย ค่าเบี่ยงเบนของค่าที่แท้จริงของตัวแปรตามจากค่าที่คำนวณได้จะแสดงลักษณะ ...