แบบจำลองเศรษฐมิติของสมการพหุคูณเชิงเส้น การพยากรณ์ด้วยแบบจำลองการถดถอยพหุคูณ เรียกว่าค่า...
การทำนายแบบจำลองหลายแบบ การถดถอยเชิงเส้นเกี่ยวข้องกับการประมาณค่าที่คาดหวังของตัวแปรตามเมื่อใด จุดที่กำหนด x ตัวแปรอิสระรวมอยู่ในสมการการถดถอย มีการพยากรณ์จุดและช่วงเวลา
พยากรณ์จุด - นี้ ค่าที่คำนวณได้ตัวแปรตามที่ได้จากการแทนค่าพยากรณ์ (ระบุโดยผู้วิจัย) ของตัวแปรอิสระลงในสมการถดถอยเชิงเส้นพหุคูณ หากระบุค่าไว้ ค่าที่ทำนายของตัวแปรตาม (การพยากรณ์จุด) จะเท่ากับ
การคาดการณ์ช่วง คือขั้นต่ำและ ค่าสูงสุดตัวแปรตามระหว่าง
ซึ่งมันตกอยู่กับความน่าจะเป็นที่กำหนดและสำหรับค่าที่กำหนดของตัวแปรอิสระ
การคาดการณ์ช่วงเวลาสำหรับ ฟังก์ชันเชิงเส้นคำนวณโดยสูตร
ที่ไหน ที T คือค่าทางทฤษฎีของเกณฑ์ของนักเรียน df=n- – เสื้อ– 1 องศาอิสระ; สย- มาตรฐานบกพร่องพยากรณ์โดยคำนวณตามสูตร
(2.57)
ที่ไหน เอ็กซ์– เมทริกซ์ของค่าเริ่มต้นของตัวแปรอิสระ เอ็กซ์ pr - เมทริกซ์ - คอลัมน์ของค่าทำนายของตัวแปรอิสระของแบบฟอร์ม
ให้เราค้นหาค่าที่คาดการณ์ของใบเสร็จรับเงินภาษี (ตัวอย่าง 2.1) โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างตัวบ่งชี้นั้นอธิบายโดยสมการ
มาตั้งค่าการทำนายของตัวแปรอิสระกัน:
- – จำนวนพนักงาน Xj: 500,000 คน
- – ปริมาณการขนส่งในอุตสาหกรรมการผลิต เอ็กซ์ 2: 65,000 ล้านรูเบิล;
- – การผลิตพลังงาน x3:15,000 ล้านรูเบิล
มาดูการพยากรณ์จุดและช่วงเวลาของการรับภาษีกันดีกว่า
สำหรับค่าที่กำหนดของตัวแปรอิสระ รายได้ภาษีเฉลี่ยจะเป็น
เวกเตอร์ของค่าทำนายของตัวแปรอิสระจะมีลักษณะดังนี้
ข้อผิดพลาดในการคาดการณ์ที่คำนวณโดยสูตร (2.57) คือ 5556.7 ค่าตารางเกณฑ์ t พร้อมจำนวนองศาอิสระ ดีเอฟ = 44 และระดับนัยสำคัญ a = 0.05 เท่ากับ 2.0154 ดังนั้นค่าที่คาดการณ์การรับภาษีจะอยู่ภายในขอบเขต 0.95 โดยมีความน่าจะเป็น:
จาก 18,013.69 – 2.0154-5556.7=6814.1 ล้านรูเบิล;
สูงถึง 18,013.69 + 2.0154-5556.7=29,212 ล้านรูเบิล
การพยากรณ์จากแบบจำลองที่ไม่ใช่เชิงเส้น การถดถอยหลายครั้งยังสามารถดำเนินการตามสูตร (2.55)–(2.57) โดยก่อนหน้านี้ทำให้แบบจำลองเหล่านี้เชิงเส้นแล้ว
ข้อมูลหลายสาย
เมื่อก่อสร้าง แบบจำลองเศรษฐมิติสันนิษฐานว่าตัวแปรอิสระส่งผลต่อตัวแปรตามแยกกัน กล่าวคือ อิทธิพลของตัวแปรตัวเดียวต่อคุณลักษณะผลลัพธ์จะไม่เกี่ยวข้องกับอิทธิพลของตัวแปรอื่น ในความเป็นจริงทางเศรษฐกิจที่แท้จริง ปรากฏการณ์ทั้งหมดมีความเชื่อมโยงกันในระดับหนึ่ง ดังนั้นจึงแทบจะเป็นไปไม่ได้เลยที่จะบรรลุสมมติฐานนี้ การมีอยู่ของความสัมพันธ์ระหว่างตัวแปรอิสระนำไปสู่ความจำเป็นในการประเมินผลกระทบต่อผลลัพธ์ของการวิเคราะห์สหสัมพันธ์-การถดถอย
มีความสัมพันธ์เชิงฟังก์ชันและสุ่มระหว่างตัวแปรอธิบาย ในกรณีแรกมีคนพูดถึงข้อผิดพลาดในข้อมูลจำเพาะของแบบจำลองซึ่งจะต้องแก้ไข
การเชื่อมต่อเชิงฟังก์ชันเกิดขึ้นหากสมการการถดถอยรวมตัวแปรทั้งหมดที่รวมอยู่ในเอกลักษณ์เป็นตัวแปรอธิบายโดยเฉพาะ ตัวอย่างเช่น เราสามารถพูดได้ว่ารายได้ Y คือผลรวมของการบริโภค C และการลงทุน ฉันกล่าวคือ มีตัวตนอยู่ เราถือว่าระดับนั้น อัตราดอกเบี้ย r ขึ้นอยู่กับรายได้เช่น รุ่นใน ปริทัศน์สามารถนำเสนอในรูปแบบ
นักวิจัยที่ไม่มีประสบการณ์ซึ่งต้องการปรับปรุงแบบจำลองสามารถรวมตัวแปร "การบริโภค" และ "การลงทุน" ไว้ในสมการได้ ซึ่งจะนำไปสู่ความสัมพันธ์เชิงหน้าที่ระหว่างตัวแปรอธิบาย:
ความสัมพันธ์เชิงหน้าที่ของคอลัมน์เมทริกซ์ เอ็กซ์จะทำให้หาไม่ได้ การตัดสินใจเท่านั้นสมการ
การถดถอยเพราะว่า และการหาค่าผกผัน
เมทริกซ์เกี่ยวข้องกับการหาร การบวกพีชคณิตเมทริกซ์ของดีเทอร์มิแนนต์ซึ่งได้รับมา
มิฉะนั้นก็จะเป็นเช่นนั้น ศูนย์.
บ่อยครั้งที่มีความสัมพันธ์แบบสุ่มระหว่างตัวแปรอธิบาย ซึ่งนำไปสู่การลดลง
ค่ากำหนดเมทริกซ์: ยิ่งการเชื่อมต่อแข็งแกร่งขึ้น
ยิ่งดีเทอร์มิแนนต์มีขนาดเล็กลง สิ่งนี้นำไปสู่การเพิ่มขึ้นไม่เพียงแต่ในการประมาณค่าพารามิเตอร์ที่ได้รับโดยใช้ LSM เท่านั้น แต่ยังรวมถึงข้อผิดพลาดมาตรฐานด้วยซึ่งคำนวณโดยสูตร (2.24):
ซึ่งอย่างที่เราเห็นก็ใช้เมทริกซ์เช่นกัน มีความสัมพันธ์กันระหว่างตัวแปรอธิบายสองตัว ( ความสัมพันธ์ระหว่างกัน) และระหว่างหลายรายการ (ความหลากหลาย)
มีสัญญาณหลายอย่างที่บ่งบอกถึงการมีอยู่ของความหลากหลาย โดยเฉพาะสัญญาณเหล่านี้คือ:
- เป็นสัญญาณของสัมประสิทธิ์การถดถอยที่ไม่สอดคล้องกับทฤษฎีเศรษฐศาสตร์ เช่น เรารู้ว่าตัวแปรอธิบาย เอ็กซ์มีผลโดยตรงต่อตัวแปร y ที่กำลังอธิบายอยู่ ในขณะเดียวกัน ค่าสัมประสิทธิ์การถดถอยสำหรับตัวแปรนี้น้อยกว่าศูนย์
- – การเปลี่ยนแปลงที่สำคัญในพารามิเตอร์ของแบบจำลองโดยมีการลดลงเล็กน้อย (เพิ่มขึ้น) ในปริมาณของประชากรที่ศึกษา
- – ไม่มีนัยสำคัญของพารามิเตอร์การถดถอยเนื่องจากค่าสูงของข้อผิดพลาดมาตรฐานของพารามิเตอร์
การมีอยู่ของความสัมพันธ์ระหว่างตัวแปรอิสระสามารถเปิดเผยได้โดยใช้ตัวบ่งชี้ความสัมพันธ์ระหว่างตัวแปรเหล่านั้น โดยเฉพาะการใช้ค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ ร XiX ซึ่งสามารถเขียนเป็นเมทริกซ์ได้
(2.58)
ค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปรกับตัวมันเอง เท่ากับหนึ่ง (ช xx = 1) และค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปร * กับตัวแปร *, ■ เท่ากับค่าสัมประสิทธิ์สหสัมพันธ์ของตัวแปร เอ็กซ์เจซีตัวแปร X, (ช x x =ร x x ). เพราะฉะนั้น, เมทริกซ์ที่กำหนดมีความสมมาตร ดังนั้นจึงระบุเฉพาะเส้นทแยงมุมหลักและองค์ประกอบด้านล่างเท่านั้น:
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ที่สูงบ่งบอกถึงการมีอยู่ของความสัมพันธ์ระหว่างกันเช่น การเชื่อมต่อเชิงเส้นระหว่างตัวแปรอธิบายสองตัว ยิ่งค่าสูงเท่าใดความสัมพันธ์ระหว่างกันก็จะยิ่งสูงขึ้นเท่านั้น เนื่องจากแทบจะเป็นไปไม่ได้เลยที่จะหลีกเลี่ยงการขาดความสัมพันธ์ระหว่างตัวแปรอธิบายเมื่อสร้างโมเดล คำแนะนำถัดไปเกี่ยวกับการรวมตัวแปรสองตัวไว้ในแบบจำลองเพื่อเป็นการอธิบาย ตัวแปรทั้งสองสามารถรวมอยู่ในโมเดลได้หากมีความสัมพันธ์กัน
เหล่านั้น. ความรัดกุมของความสัมพันธ์ระหว่างตัวแปรผลลัพธ์และตัวแปรอธิบายมีมากกว่าความหนาแน่นของความสัมพันธ์ระหว่างตัวแปรอธิบาย
การมีอยู่ของ multicollinearity สามารถยืนยันได้โดยการค้นหาดีเทอร์มิแนนต์ของเมทริกซ์ (2.58) หากไม่มีความสัมพันธ์ระหว่างตัวแปรอิสระอย่างสมบูรณ์ องค์ประกอบที่อยู่นอกเส้นทแยงมุมจะเท่ากับศูนย์ และดีเทอร์มิแนนต์ของเมทริกซ์จะเท่ากับหนึ่ง ถ้าความสัมพันธ์ระหว่างตัวแปรอิสระใกล้เคียงกับฟังก์ชัน (นั่นคือ ใกล้มาก) แล้วดีเทอร์มีแนนต์ของเมทริกซ์ zxr จะใกล้เคียงกับศูนย์
อีกวิธีหนึ่งในการวัดความเป็นหลายเส้นตรงเป็นผลมาจากการวิเคราะห์สูตรสำหรับความคลาดเคลื่อนมาตรฐานของสัมประสิทธิ์การถดถอย (2.28):
ต่อไปนี้จากสูตรนี้ ค่าคลาดเคลื่อนมาตรฐานจะยิ่งมากขึ้น ค่าก็จะยิ่งน้อยลง ซึ่งเรียกว่า ปัจจัยเงินเฟ้อแปรปรวน (หรือปัจจัยการกระจายตัวของการกระจายตัว ) วีไอเอฟ:
โดยที่ค่าสัมประสิทธิ์การกำหนดพบสำหรับสมการการพึ่งพาของตัวแปร เอ็กซ์จจากตัวแปรอื่นๆ ที่รวมอยู่ในแบบจำลองการพิจารณาการถดถอยพหุคูณ
เนื่องจากค่าสะท้อนถึงความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปร เอ็กซ์จและตัวแปรอธิบายอื่น ๆ ที่จริงแล้วมันเป็นลักษณะเฉพาะของพหุคอลลิเนียร์ที่สัมพันธ์กับตัวแปรนี้ เอ็กซ์จ.ในกรณีที่ไม่มีการเชื่อมต่อ ตัวบ่งชี้ วีไอเอฟ X จะเท่ากับ (หรือใกล้เคียง) หนึ่ง การเสริมความแข็งแกร่งของการเชื่อมต่อนำไปสู่แนวโน้มของตัวบ่งชี้นี้เป็นอนันต์ พวกเขาคิดว่าถ้า วีไอเอฟ X >3 สำหรับแต่ละตัวแปร * จากนั้น multicollinearity จะเกิดขึ้น
เครื่องวัดหลายเส้นก็เรียกอีกอย่างว่า ตัวบ่งชี้ (จำนวน) ของเงื่อนไข เมทริกซ์ เท่ากับอัตราส่วนของค่าลักษณะเฉพาะสูงสุดและต่ำสุดของเมทริกซ์นี้:
เชื่อกันว่าหากลำดับของอัตราส่วนนี้เกิน 10s–106 จะเกิด multicollinearity ที่แข็งแกร่งขึ้น
ลองตรวจสอบการมีอยู่ของ multicollinearity ในตัวอย่าง 2.1 ของเรา เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่มีรูปแบบ
สังเกตได้ว่าการเชื่อมโยงระหว่างตัวแปรอธิบายค่อนข้างใกล้กัน โดยเฉพาะระหว่างตัวแปร Xj และ x2; X] และ x3 ซึ่งแสดงถึงความสัมพันธ์ระหว่างตัวแปรเหล่านี้ มากกว่า การเชื่อมต่อที่อ่อนแอสังเกตได้ระหว่างตัวแปร x2 และ x3 ให้เราค้นหาดีเทอร์มิแนนต์ของเมทริกซ์ r^..
ค่าผลลัพธ์จะใกล้กับศูนย์มากกว่าค่าหนึ่ง ซึ่งบ่งชี้ถึงการมีอยู่ของมัลติคอลลิเนียร์ในตัวแปรอธิบาย
ลองตรวจสอบความถูกต้องของการรวมตัวแปรอิสระทั้งสามตัวในแบบจำลองการถดถอยโดยใช้กฎ (2.59) ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ของตัวแปรตามและตัวแปรอิสระคือ
มีค่ามากกว่าตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรอิสระ ดังนั้นกฎ (2.59) จึงเป็นที่พอใจ โดยสามารถรวมตัวแปรทั้งสามตัวไว้ในแบบจำลองการถดถอยได้
ให้เราวัดระดับของตัวแปรหลายเส้นตรงของตัวแปรโดยใช้ปัจจัยอัตราเงินเฟ้อแปรปรวน ( วีไอเอฟ). ในการทำเช่นนี้ จำเป็นต้องคำนวณค่าสัมประสิทธิ์การตัดสินใจสำหรับการถดถอย:
ในการดำเนินการนี้ จำเป็นต้องใช้ LSM กับการถดถอยแต่ละครั้ง ประเมินพารามิเตอร์ และคำนวณค่าสัมประสิทธิ์การกำหนด สำหรับตัวอย่างของเรา ผลการคำนวณจะเป็นดังนี้:
ดังนั้น ค่าความแปรปรวนของอัตราเงินเฟ้อสำหรับตัวแปรอิสระแต่ละตัวจะเท่ากับ
ค่าที่คำนวณได้ทั้งหมดไม่เกิน วิกฤตเท่ากับสาม ดังนั้น เมื่อสร้างแบบจำลอง เราสามารถละเลยความสัมพันธ์ที่มีอยู่ระหว่างตัวแปรอิสระได้
ในการค้นหาค่าลักษณะเฉพาะของเมทริกซ์ (เพื่อจุดประสงค์ในการคำนวณดัชนีสภาพเงื่อนไขη (2.60)) จำเป็นต้องค้นหาวิธีแก้สมการคุณลักษณะ
เมทริกซ์สำหรับตัวอย่างของเราดูเหมือน
และเมทริกซ์ซึ่งเป็นโมดูลัสของดีเทอร์มิแนนต์ที่ต้องเท่ากับศูนย์จะเป็นดังนี้:
พหุนามลักษณะเฉพาะใน กรณีนี้จะมีระดับที่สี่ซึ่งทำให้ยากต่อการแก้ไขปัญหาด้วยตนเอง ในกรณีนี้ขอแนะนำให้ใช้ประโยชน์จาก วิทยาศาสตร์คอมพิวเตอร์. เช่น ในพรรคพลังประชาชน อีวิวส์ได้รับค่าลักษณะเฉพาะของเมทริกซ์ต่อไปนี้:
ดังนั้นดัชนีเงื่อนไข η จะเท่ากับ
ซึ่งบ่งบอกถึงการมีอยู่ของ multicollinearity ที่แข็งแกร่งในแบบจำลอง
วิธีการกำจัด multicollinearity มีดังนี้
- 1. การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรที่รวมอยู่ในแบบจำลองการถดถอยเป็นการอธิบาย (อิสระ) เพื่อเลือกเฉพาะตัวแปรที่มีความเกี่ยวข้องกันเพียงเล็กน้อยเท่านั้น
- 2. การแปลงฟังก์ชันของตัวแปรที่เกี่ยวข้องอย่างใกล้ชิด ตัวอย่างเช่น เราถือว่ารายได้ภาษีในเมืองขึ้นอยู่กับจำนวนผู้อยู่อาศัยและพื้นที่ของเมือง แน่นอนว่าตัวแปรเหล่านี้จะเกี่ยวข้องกันอย่างใกล้ชิด พวกเขาสามารถถูกแทนที่ด้วยตัวแปรสัมพัทธ์หนึ่ง "ความหนาแน่นของประชากร"
- 3. หากไม่สามารถเปลี่ยนแปลงรายการตัวแปรอิสระได้ด้วยเหตุผลบางประการคุณสามารถใช้ได้ วิธีการพิเศษการปรับเปลี่ยนแบบจำลองเพื่อขจัดความเป็นหลายโคลิเนียร์: การถดถอยแบบสัน (การถดถอยแบบสัน) วิธีส่วนประกอบหลัก
แอปพลิเคชัน การถดถอยสันเขาเกี่ยวข้องกับการปรับองค์ประกอบของเส้นทแยงมุมหลักของเมทริกซ์ด้วยค่าบวกที่กำหนดโดยพลการ τ แนะนำให้ใช้ค่าตั้งแต่ 0.1 ถึง 0.4 N. Draper, G. Smith ในงานของพวกเขาได้ให้หนึ่งในวิธีการสำหรับการเลือกค่า τ "อัตโนมัติ" ซึ่งเสนอโดย Hoerl, Kennard และ Beldwin:
(2.61)
ที่ไหน ตคือจำนวนพารามิเตอร์ (ไม่รวมคำศัพท์อิสระ) ในแบบจำลองการถดถอยดั้งเดิม เอสเอส e คือผลรวมที่เหลือของกำลังสองที่ได้จากแบบจำลองการถดถอยดั้งเดิมโดยไม่ต้องปรับค่ามัลติโคลิเนียร์ริตี้ กเป็นเวกเตอร์คอลัมน์ของสัมประสิทธิ์การถดถอยที่ถูกแปลงโดยสูตร
(2.62)
ที่ไหน ซีจ- พารามิเตอร์พร้อมตัวแปร y ในแบบจำลองการถดถอยดั้งเดิม
หลังจากเลือกค่า τ แล้ว สูตรในการประมาณค่าพารามิเตอร์การถดถอยจะมีลักษณะดังนี้
(2.63)
ที่ไหน ฉัน – เมทริกซ์เอกลักษณ์; เอ็กซ์,- เมทริกซ์ของค่าของตัวแปรอิสระ: เริ่มต้นหรือแปลงตามสูตร (2.64) Υ τ คือเวกเตอร์ของค่าของตัวแปรตาม: เริ่มต้นหรือแปลงโดยสูตร (2.65)
(2.64)
และตัวแปรผลลัพธ์
ในกรณีนี้ หลังจากประมาณค่าพารามิเตอร์ตามสูตร (2.63) แล้ว จำเป็นต้องดำเนินการถดถอยกับตัวแปรเดิมต่อไป โดยใช้ความสัมพันธ์
การประมาณค่าพารามิเตอร์การถดถอยที่ได้รับโดยใช้สูตร (2.63) จะมีอคติ อย่างไรก็ตาม เนื่องจากดีเทอร์มิแนนต์ของเมทริกซ์มีค่ามากกว่าดีเทอร์มิแนนต์ของเมทริกซ์ ความแปรปรวนของการประมาณค่าของพารามิเตอร์การถดถอยจะลดลง ซึ่งจะส่งผลเชิงบวกต่อคุณสมบัติการทำนายของแบบจำลอง
พิจารณาการประยุกต์ใช้การถดถอยสันตามตัวอย่าง 2.1 ให้เราหาค่าของ τ โดยใช้สูตร (2.61) ในการทำเช่นนี้ อันดับแรกเราคำนวณเวกเตอร์ของสัมประสิทธิ์การถดถอยที่แปลงแล้วโดยใช้สูตร (2.62):
สินค้าคือ 1.737-109. ดังนั้น τ ที่แนะนำจะเป็น
หลังจากใช้สูตร (2.63) และการแปลงตามสูตร (2.66) เราจะได้สมการการถดถอย
แอปพลิเคชัน วิธีองค์ประกอบหลัก เกี่ยวข้องกับการเปลี่ยนจากตัวแปรอิสระ x ไปเป็นตัวแปรอิสระร่วมกัน ζ ซึ่งเรียกว่า หลัก
ส่วนประกอบ. แต่ละองค์ประกอบหลัก z สามารถแสดงเป็น การรวมกันเชิงเส้นตัวแปรอธิบายแบบกึ่งกลาง (หรือแบบมาตรฐาน) ที:.จำได้ว่าการทำให้ตัวแปรอยู่ตรงกลางเกี่ยวข้องกับการลบค่า i-th แต่ละค่าของค่าที่กำหนด เจ-ธตัวแปรของค่าเฉลี่ย:
และการกำหนดมาตรฐาน (scaling) คือการหารนิพจน์ (2.67) โดยค่าเบี่ยงเบนมาตรฐานที่คำนวณสำหรับค่าเริ่มต้นของตัวแปร Xj
เนื่องจากตัวแปรอิสระมักจะมี ขนาดที่แตกต่างกันการวัดสูตร (2.68) ถือว่าเหมาะกว่า
จำนวนส่วนประกอบสามารถน้อยกว่าหรือเท่ากับจำนวนตัวแปรอิสระดั้งเดิมได้ ร.หมายเลขส่วนประกอบ ถึงสามารถเขียนได้ดังนี้:
(2.69)
แสดงให้เห็นว่าค่าประมาณในสูตร (2.69) สอดคล้องกับองค์ประกอบต่างๆ ถึง- eigenvector ของเมทริกซ์ โดยที่ ตเป็นเมทริกซ์ขนาดที่มีตัวแปรมาตรฐาน การกำหนดหมายเลขของส่วนประกอบหลักไม่ได้กำหนดไว้เอง องค์ประกอบหลักประการแรกมีความแปรปรวนสูงสุด ซึ่งสอดคล้องกับค่าลักษณะเฉพาะสูงสุดของเมทริกซ์ สุดท้ายคือความแปรปรวนขั้นต่ำและค่าลักษณะเฉพาะที่น้อยที่สุด
ส่วนแบ่งของผลต่าง ถึง-องค์ประกอบที่ th ของความแปรปรวนรวมของตัวแปรอิสระคำนวณโดยสูตร
ที่ไหน เอ็กซ์ k คือค่าลักษณะเฉพาะที่สอดคล้องกับองค์ประกอบนี้ ตัวหารของสูตร (2.70) มีผลรวมของค่าลักษณะเฉพาะทั้งหมดของเมทริกซ์
หลังจากคำนวณค่าของส่วนประกอบ z แล้ว การถดถอยจะถูกสร้างขึ้นโดยใช้วิธีกำลังสองน้อยที่สุด ตัวแปรตามในการถดถอยในองค์ประกอบหลัก (2.71) ควรอยู่ตรงกลาง (มาตรฐาน) ตามสูตร (2.67) หรือ (2.68)
ที่ไหน ที y – ตัวแปรตามที่เป็นมาตรฐาน (ศูนย์กลาง) คือค่าสัมประสิทธิ์การถดถอยขององค์ประกอบหลัก เป็นส่วนประกอบหลักเรียงลำดับตามค่าลักษณะเฉพาะจากมากไปหาน้อย เอ็กซ์ถึง ; δ เป็นเศษเหลือสุ่ม
หลังจากประมาณค่าพารามิเตอร์การถดถอย (2.71) แล้ว เราสามารถดำเนินการสมการการถดถอยในตัวแปรเดิมได้โดยใช้นิพจน์ (2.67)–(2.69)
พิจารณาการประยุกต์ใช้วิธีส่วนประกอบหลักกับข้อมูลของตัวอย่างที่ 2.1 โปรดทราบว่าเมทริกซ์สำหรับตัวแปรมาตรฐานในขณะเดียวกันก็เป็นเมทริกซ์ของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ระหว่างตัวแปรอิสระ ได้คำนวณไว้แล้วและเท่ากับ
ค้นหาค่าลักษณะเฉพาะและเวกเตอร์ลักษณะเฉพาะของเมทริกซ์นี้โดยใช้ PPP ความคิดเห็นเราได้รับผลลัพธ์ดังต่อไปนี้
ค่าลักษณะเฉพาะของเมทริกซ์:
สัดส่วนความแปรปรวนของตัวแปรอิสระที่สะท้อนโดยองค์ประกอบคือ
ลองรวมเวกเตอร์ลักษณะเฉพาะของเมทริกซ์เข้าด้วยกันโดยเขียนเป็นคอลัมน์ของเมทริกซ์ด้านล่างนี้ เอฟพวกมันถูกเรียงลำดับตามค่าลักษณะเฉพาะจากมากไปหาน้อย เช่น คอลัมน์แรกคือเวกเตอร์ลักษณะเฉพาะของค่าสูงสุด หมายเลขของตัวเองฯลฯ :
ดังนั้นองค์ประกอบทั้งสาม (ตรงกับองค์ประกอบทั้งสาม เวกเตอร์ลักษณะเฉพาะ) สามารถเขียนได้เป็น
หลังจากกำหนดมาตรฐานตัวแปรเริ่มต้นตามสูตร (2.68) และคำนวณค่าของส่วนประกอบ (โดยค่า n ของแต่ละองค์ประกอบ) โดยใช้กำลังสองน้อยที่สุด เราจะพบพารามิเตอร์ของสมการ (2.71):
ในผลลัพธ์สมการถดถอย เฉพาะพารามิเตอร์ที่องค์ประกอบแรกเท่านั้นที่มีนัยสำคัญ นี่เป็นผลตามธรรมชาติเมื่อพิจารณาสิ่งนั้น องค์ประกอบที่กำหนดอธิบายความแปรผันของตัวแปรอิสระได้ 70.8% เนื่องจากส่วนประกอบต่างๆ มีความเป็นอิสระ เมื่อส่วนประกอบบางอย่างถูกแยกออกจากโมเดล พารามิเตอร์ของสมการสำหรับส่วนประกอบอื่นๆ จึงไม่เปลี่ยนแปลง ดังนั้นเราจึงมีสมการการถดถอยที่มีองค์ประกอบเดียว:
ลองแปลงนิพจน์ผลลัพธ์เป็นการถดถอยด้วยตัวแปรดั้งเดิม
ดังนั้นเราจึงได้สมการถดถอยโดยใช้วิธีองค์ประกอบหลัก
การกำจัด multicollinearity โดยใช้การถดถอยแบบสันและวิธีการองค์ประกอบหลักทำให้เกิดการเปลี่ยนแปลงบางอย่างในพารามิเตอร์ของการถดถอยดั้งเดิมซึ่งมีรูปแบบ
โปรดทราบว่าการเปลี่ยนแปลงเหล่านี้มีขนาดค่อนข้างเล็ก ซึ่งบ่งชี้ถึงระดับของเส้นตรงหลายเส้นที่ต่ำ
- ดูตัวอย่าง วุชคอฟ ไอ., โบยาดซิเอวา แอล., โซลาคอฟ อี.สมัครแล้ว การวิเคราะห์การถดถอย:ต่อ. จากบัลแกเรีย อ.: การเงินและสถิติ พ.ศ. 2530 หน้า 110
- เดรเปอร์ เอ็น., สมิธ จี.พระราชกฤษฎีกา ปฏิบัติการ ส.514.
ที.จี. ตูร์เนวา
การประชุมเชิงปฏิบัติการเรื่องเศรษฐศาสตร์
โมเดลการถดถอยคู่เชิงเส้น
เศรษฐมิติเป็นวิทยาศาสตร์ที่ศึกษาความสัมพันธ์เชิงปริมาณและคุณภาพเฉพาะระหว่างวัตถุและกระบวนการทางเศรษฐกิจโดยใช้วิธีการและแบบจำลองทางคณิตศาสตร์และสถิติ (พจนานุกรมสารานุกรมใหญ่ - M., BRE, 1977)
วิธีแรกคือวิธีทางเศรษฐมิติเป็นวิธีการวิเคราะห์ทางสถิติของข้อมูลทางเศรษฐกิจที่เฉพาะเจาะจง
การประเมินผลลัพธ์ของการสร้างแบบจำลองทางเศรษฐมิติทำได้โดยการแก้ปัญหาเชิงคุณภาพและเชิงปริมาณ องค์ประกอบเชิงคุณภาพประกอบด้วยการสร้างความสอดคล้องระหว่างแบบจำลองที่สร้างขึ้นกับแนวคิดเศรษฐศาสตร์พื้นฐาน และองค์ประกอบเชิงปริมาณอยู่ที่ความแม่นยำของการประมาณข้อมูลที่มีอยู่จากข้อมูลการคำนวณ
จากมุมมองเชิงปฏิบัติ งานหลักของเศรษฐมิติ ได้แก่ :
การสร้างแบบจำลองทางเศรษฐมิติ - การแสดงแบบจำลองทางเศรษฐศาสตร์ในรูปแบบทางคณิตศาสตร์ที่สะดวกสำหรับการวิเคราะห์เชิงประจักษ์ ปัญหานี้เรียกว่าปัญหาสเปคที่สามารถแก้ไขได้หลายวิธี
การประเมินพารามิเตอร์ของแบบจำลองที่สร้างขึ้นซึ่งช่วยให้สามารถระบุลักษณะความเพียงพอของแบบจำลองด้วยข้อมูลจริง งานที่ระบุถูกตัดสินใจในขั้นตอนการกำหนดพารามิเตอร์
ตรวจสอบคุณภาพของโมเดลผลลัพธ์โดยรวม งานนี้นำไปใช้ในขั้นตอนการตรวจสอบ
โดยใช้แบบจำลองที่สร้างขึ้นเพื่อการพยากรณ์
แบบจำลองการถดถอยเชิงเส้นคู่เป็นกรณีพิเศษของแบบจำลองการถดถอยหลายตัวแปร การศึกษานี้เป็นที่สนใจโดยอิสระ เนื่องจากมีคุณสมบัติเฉพาะหลายประการของแบบจำลองหลายมิติทั่วไป แต่มีการมองเห็นมากกว่าและง่ายต่อการศึกษา
การตั้งถิ่นฐานและงานกราฟิกเกี่ยวกับเศรษฐมิติ
แบบจำลองการถดถอยเชิงเส้นคู่
สร้างเขตข้อมูลความสัมพันธ์และกำหนดสมมติฐานเกี่ยวกับรูปแบบของความสัมพันธ์
ให้มีข้อมูลเชิงประจักษ์สองชุด เอ็กซ์ (x 1 , x 2 , …, x n ) และ ย (ย 1 , ย 2 , …, ย n ) จุดที่เกี่ยวข้องกับพิกัด (x ฉัน , ย ฉัน ), ที่ไหน ฉัน=1,2,…, n, แสดงผลบนระนาบพิกัด ภาพดังกล่าวเรียกว่า สนามความสัมพันธ์. ให้ตำแหน่งของจุดเชิงประจักษ์ช่วยให้เราสามารถถือว่ามีความสัมพันธ์เชิงเส้นระหว่างตัวแปรต่างๆ เอ็กซ์ และ ย.
โดยทั่วไปแล้ว ตัวแบบการถดถอยเชิงเส้นคู่ตามทฤษฎีสามารถแสดงเป็น:
ย=
หรือ ย ฉัน =
,
ฉัน=1,2,…,
n;
ที่ไหน ย– ตัวแปรอธิบาย (ผลลัพธ์, ขึ้นอยู่กับ, ภายนอก)
เอ็กซ์ -ตัวแปรหรือตัวถดถอยเชิงอธิบาย (แฟกทอเรียล, อิสระ, ภายนอก)
- พารามิเตอร์ทางทฤษฎี (สัมประสิทธิ์ตัวเลข) ของการถดถอยที่จะประมาณ
ε ฉัน- การเบี่ยงเบนแบบสุ่ม (การก่อกวน, ข้อผิดพลาด)
สมมติฐานหลัก:
3ก. ม ε ฉัน =0, ฉัน=1,2,…, n.
3บี ดี ε ฉัน\u003d σ 2, ฉัน=1,2,…, n. เรียกว่าเงื่อนไขสำหรับความแปรปรวนของข้อผิดพลาดที่ไม่ขึ้นอยู่กับจำนวนการสังเกต การรักร่วมเพศ; เรียกว่ากรณีที่ไม่ตรงตามเงื่อนไขการรักร่วมเพศ ความแตกต่างกัน
3 วินาที ม( ε ฉัน ε เจ )=0 ณ ฉัน ≠ เจ ข้อผิดพลาดที่ไม่สัมพันธ์กันสำหรับการสังเกตที่แตกต่างกัน หากไม่ตรงตามเงื่อนไขนี้ พูดคุยเกี่ยวกับ ความสัมพันธ์อัตโนมัติข้อผิดพลาด
การก่อกวนมีการกระจายตามปกติ ตัวแปรสุ่ม: ε ฉัน ≈ เอ็น(0, σ 2 ).
ความคิดเห็นเพื่อให้ได้สมการการถดถอย สามหลักแรกก็เพียงพอแล้ว ในการประมาณความแม่นยำของสมการการถดถอยและพารามิเตอร์ต่างๆ จะต้องเป็นไปตามข้อกำหนดเบื้องต้นที่สี่
หน้าที่ของการวิเคราะห์การถดถอยเชิงเส้นคือการใช้ข้อมูลทางสถิติที่มีอยู่ (x ฉัน , ย ฉัน ), ฉัน=1,2,…, nสำหรับตัวแปร X และ Y ให้หาค่าประมาณที่ดีที่สุดของพารามิเตอร์ที่ไม่รู้จัก เช่น สร้างสิ่งที่เรียกว่า สมการถดถอยเชิงประจักษ์
ที่ไหน
การประมาณค่าความคาดหวังทางคณิตศาสตร์แบบมีเงื่อนไข М(Y/ X=x i);
การประมาณค่าพารามิเตอร์ที่ไม่รู้จักเรียกว่า ค่าสัมประสิทธิ์เชิงประจักษ์ การถดถอยในแต่ละกรณีสามารถเขียนได้
, ฉัน=1,2,…, n,
ที่มีการเบี่ยงเบน จ ฉัน– ข้อผิดพลาด (ตกค้าง) ของแบบจำลองซึ่งเป็นการประมาณค่าความเบี่ยงเบนสุ่มทางทฤษฎี ε ฉัน .
2. คำนวณพารามิเตอร์ของสมการการถดถอยเชิงเส้นตัวอย่างโดยใช้วิธีกำลังสองน้อยที่สุด (LSM)
วิธีการดั้งเดิมในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นใช้วิธีกำลังสองน้อยที่สุด (LSM) ในวิธีกำลังสองน้อยที่สุด การประมาณค่าพารามิเตอร์แบบจำลองจะถูกสร้างขึ้นในลักษณะที่จะลดผลรวมของข้อผิดพลาดของแบบจำลองกำลังสองให้เหลือน้อยที่สุดจากการสังเกตทั้งหมด ดังนั้นเกณฑ์กำลังสองน้อยที่สุดจึงเขียนได้ดังนี้:
เงื่อนไขที่จำเป็นสำหรับการมีอยู่ของฟังก์ชันขั้นต่ำ ส(ข 0 , ข 1 ) คือความเสมอภาคกับศูนย์ของอนุพันธ์ย่อยเทียบกับสิ่งที่ไม่รู้ ข 0 และ ข 1 (เพื่อความกระชับ เราจะละเว้นดัชนีผลรวมใกล้กับเครื่องหมายของผลรวม Σ):
ระบบสมการนี้เรียกว่า ระบบสมการปกติสำหรับค่าสัมประสิทธิ์การถดถอย
การแก้ระบบสมการเชิงเส้นสองสมการนี้โดยไม่ทราบค่าสองตัว ตัวอย่างเช่น โดยวิธีการทดแทน เราจะได้:
ที่ไหน
ค่าเฉลี่ยตัวอย่างของตัวแปร X และ Y
.
จากมุมมองทางเรขาคณิต การลดผลรวมของการเบี่ยงเบนกำลังสองให้เหลือน้อยที่สุดหมายถึงการเลือกเส้นตรงเพียงเส้นเดียว (จากเส้นตรงทั้งหมดที่มีพารามิเตอร์) ที่อยู่ใกล้กับระบบจุดตัวอย่างมากที่สุด (x ฉัน , ย ฉัน ), ฉัน=1,2,…, n.
สมการการถดถอยจะเสริมด้วยตัวบ่งชี้ความแน่นของการเชื่อมต่อเสมอ เมื่อใช้การถดถอยเชิงเส้น ตัวบ่งชี้นี้คือ สัมประสิทธิ์สหสัมพันธ์เชิงเส้น ร เอ็กซ์ซี. สูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้นมีหลายประเภท สูตรหลักคือ:
.
ความสัมพันธ์ระหว่างตัวแปรเรียกว่า direct if ร เอ็กซ์ซี . >0, และในทางกลับกันถ้า ร เอ็กซ์ซี
สำหรับการคำนวณเชิงปฏิบัติ สูตรที่สะดวกที่สุดคือ
,
เนื่องจากหาค่าสัมประสิทธิ์สหสัมพันธ์ได้จากข้อมูลเชิงสังเกตและค่า ร เอ็กซ์ซีข้อผิดพลาดในการปัดเศษจะไม่ได้รับผลกระทบ
ค่าสัมประสิทธิ์สหสัมพันธ์รับค่าตั้งแต่ -1 ถึง +1
โดยมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ การเชื่อมต่อ 1 รายการแสดงด้วยการพึ่งพาฟังก์ชันเชิงเส้น ในกรณีนี้ค่าที่สังเกตได้ทั้งหมดจะอยู่บนเส้นถดถอย
ที่ ร เอ็กซ์ซี=0 ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ ใน รูปแบบเชิงเส้นไม่มา. เส้นถดถอยขนานกับแกน x
ที่ ร เอ็กซ์ซี > 0 - ความสัมพันธ์ระหว่างตัวแปรเรียกว่าโดยตรง และเมื่อใด ร เอ็กซ์ซี
คุณสามารถใช้มาตราส่วนเพื่อระบุลักษณะความแข็งแกร่งของพันธะได้ ชาดก.
ดัชนี ความใกล้ชิดของการสื่อสาร |
|||||
ลักษณะเฉพาะ กองกำลังสื่อสาร |
ปานกลาง |
สังเกตเห็นได้ชัดเจน |
สูงมาก |
ในการประเมินคุณภาพของการเลือกฟังก์ชันเชิงเส้น จะมีการคำนวณกำลังสองของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น ร เอ็กซ์ซี 2 , เรียกว่า ค่าสัมประสิทธิ์การตัดสินใจแสดงถึงค่าสัมประสิทธิ์การตัดสินใจ ร 2 , ที่. เรามี
ร 2 = ร เอ็กซ์ซี 2 .
ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของคุณลักษณะผลลัพธ์ Y ซึ่งอธิบายโดยการถดถอย ในความแปรปรวนรวมของคุณลักษณะผลลัพธ์ ตามมูลค่า 1- ร 2 ระบุลักษณะสัดส่วนของความแปรปรวน Y ที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้คำนึงถึงในแบบจำลอง
ความคิดเห็นการคำนวณ ร 2 ถูกต้องหากรวมค่าคงที่ไว้ในสมการการถดถอย
สมการการถดถอยเชิงประจักษ์ถูกกำหนดโดยอาศัยสถิติจำนวนจำกัด แน่นอนว่าค่าสัมประสิทธิ์ของสมการการถดถอยเชิงประจักษ์เป็นตัวแปรสุ่มที่แตกต่างกันไปในแต่ละตัวอย่าง เมื่อดำเนินการ การวิเคราะห์ทางสถิติไม่จำเป็นต้องเปรียบเทียบสัมประสิทธิ์การถดถอยเชิงประจักษ์ ข 0
และ ข 1
ด้วยค่าคาดหวังทางทฤษฎีบางประการ
ค่าสัมประสิทธิ์เหล่านี้ การวิเคราะห์นี้ดำเนินการตามแผนการทดสอบสมมติฐานทางสถิติ
เพื่อทดสอบสมมติฐาน
ฮ 0: ข 1 = β 1 ,
ฮ 1: ข 1 ≠ β 1
มีการใช้สถิติ
ซึ่งหากสมมติฐาน H 0 เป็นจริง จะมีการกระจายตัวของนักศึกษาด้วยจำนวนดีกรีอิสระ df
= n
– 2
, ที่ไหน
- ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย
ข 1
,
.
สิ่งที่สำคัญที่สุดในระยะเริ่มต้นของการวิเคราะห์ทางสถิติของแบบจำลองที่สร้างขึ้นคือปัญหาในการสร้างสถานะ การพึ่งพาเชิงเส้นระหว่าง Y และ X ปัญหานี้สามารถแก้ไขได้โดยการทดสอบสมมติฐาน
ฮ 0: ข 1 = 0,
ฮ 1: ข 1 ≠ 0.
สมมติฐานในสูตรนี้มักเรียกว่า สมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอยยิ่งกว่านั้น หากยอมรับสมมติฐานว่าง ก็มีเหตุผลให้เชื่อว่าค่าของ Y ไม่ได้ขึ้นอยู่กับ X - ค่าสัมประสิทธิ์ ข 1
ไม่มีนัยสำคัญทางสถิติ(มันใกล้กับศูนย์มากเกินไป) ด้วยความเบี่ยงเบนของ H 0 จะพิจารณาค่าสัมประสิทธิ์ มีนัยสำคัญทางสถิติซึ่งบ่งชี้ว่ามีความสัมพันธ์เชิงเส้นตรงระหว่าง Y และ X ใช้ในกรณีนี้ ที– สถิติดูเหมือน:
และภายใต้สมมติฐานว่างมีการแจกแจงของนักเรียนด้วย ( n
-2)
ระดับความอิสระ.
หากคำนวณค่าแล้ว ที– สถิติ-|ที ความจริง| α มากกว่าวิกฤต (ตาราง) เสื้อ โต๊ะ, เช่น.
|ที ความจริง|>ที โต๊ะ= ที(α ; n-2),
จากนั้นสมมติฐาน H 0: ข 1 = 0, ถูกปฏิเสธเพื่อสนับสนุนทางเลือกในระดับนัยสำคัญที่เลือก สิ่งนี้เป็นการยืนยันนัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย ข 1 .
ถ้า |t ความจริง| ตาราง = ที(α; n-2), ดังนั้นสมมติฐาน H 0 จะไม่ถูกปฏิเสธ ค่าวิกฤต เสื้อ โต๊ะ= ที(α; n-2), α และจำนวนองศาอิสระ n -2 ตั้งอยู่ตามตารางที่ 2 ของภาคผนวก
ในทำนองเดียวกันโดยอิงจาก ที– สถิติ มีการทดสอบสมมติฐานเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์ ข 0 :
,
ที่ไหน
และ
-
ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยข 0
.
การประมาณช่วงพล็อตของพารามิเตอร์การถดถอย ตรวจสอบว่าผลลัพธ์ที่ได้สอดคล้องกับข้อสรุปที่ได้รับในย่อหน้าก่อนหน้าหรือไม่
สูตรการคำนวณช่วงความเชื่อมั่นมีดังนี้:
ซึ่งมีความน่าเชื่อถือ (1 - แอลฟา)ครอบคลุมพารามิเตอร์ที่กำหนด
ถ้าศูนย์อยู่ภายในขอบเขตของช่วงความเชื่อมั่น เช่น ขีดจำกัดล่างเป็นลบ และขีดจำกัดบนเป็นค่าบวก จากนั้นพารามิเตอร์ที่ประมาณไว้จะรับรู้ว่าไม่มีนัยสำคัญทางสถิติ
สร้างตารางการวิเคราะห์ความแปรปรวนเพื่อประเมินความสำคัญของสมการโดยรวม
ตรวจสอบ ความสำคัญของสมการถดถอย- หมายถึงการกำหนดว่าแบบจำลองทางคณิตศาสตร์ที่แสดงความสัมพันธ์ระหว่างตัวแปรสอดคล้องกับข้อมูลที่มีอยู่หรือไม่ และมีตัวแปรอธิบายเพียงพอในสมการเพื่ออธิบายตัวแปรตามหรือไม่
การประเมินนัยสำคัญของสมการโดยรวมจะใช้ เอฟ- เกณฑ์ของฟิชเชอร์ในกรณีนี้ มีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ นั่นคือ ฮ0: β 1 =0, ดังนั้นปัจจัยจึงไม่ส่งผลต่อผลลัพธ์
การตั้งถิ่นฐานโดยตรง เอฟ- เกณฑ์นำหน้าด้วยการวิเคราะห์ความแปรปรวนของคุณลักษณะผลลัพธ์ Y ศูนย์กลางคือการสลายตัวของผลรวมของการเบี่ยงเบนกำลังสองของตัวแปร y จากค่าเฉลี่ย ออกเป็นสองส่วน - "อธิบาย" และ "ตกค้าง" ("ไม่ได้อธิบาย"):
=
+
ผลรวมของกำลังสอง ผลรวมของกำลังสอง ผลรวมที่เหลือ
ส่วนเบี่ยงเบน = ส่วนเบี่ยงเบนที่อธิบาย + กำลังสอง
การถดถอยส่วนเบี่ยงเบน
หมายถึง SS ทั้งหมด =, SS R =
และ SS ที่เหลือ =
.
ผลรวมของการเบี่ยงเบนกำลังสองสัมพันธ์กับจำนวนดีกรีอิสระ df (ระดับ ของ เสรีภาพ), เช่น. ด้วยจำนวนอิสระของการเปลี่ยนแปลงฟีเจอร์ที่เป็นอิสระ
จำนวนองศาอิสระสัมพันธ์กับจำนวนหน่วยประชากร nและด้วยจำนวนค่าคงที่ที่กำหนดจากมัน จำนวนองศาอิสระของผลรวมที่เหลือของกำลังสองในการถดถอยเชิงเส้นคู่คือ n - 2 , ผลรวมของกำลังสอง - n -1 และจำนวนดีกรีอิสระสำหรับผลรวมแฟคทอเรียลของกำลังสอง กล่าวคือ การถดถอยที่อธิบายไว้คือ หน่วย. เรามีความเท่าเทียมกัน:
n – 1 = 1+ (n – 2).
เราจะได้การหารผลรวมของกำลังสองแต่ละค่าด้วยจำนวนองศาอิสระที่สอดคล้องกัน ค่าเฉลี่ยส่วนเบี่ยงเบนกำลังสองหรือ การกระจายตัวต่อระดับความเป็นอิสระ.
;
การกำหนดการกระจายตัวต่อหนึ่งระดับความอิสระจะทำให้การกระจายตัวอยู่ในรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระหนึ่งระดับ เราจะได้ค่าดังกล่าว เอฟ-ความสัมพันธ์หรือ เอฟ- เกณฑ์ซึ่งมีสถิติ เอฟ ภายใต้สมมติฐานว่าง
~ เอฟ(1, n-2)
เผยแพร่ตามกฎของฟิชเชอร์โดยมีระดับความเป็นอิสระ (1, n-2)
หากคำนวณค่าแล้ว เอฟ-ความสัมพันธ์ - เอฟข้อเท็จจริงในระดับความสำคัญที่กำหนด α มากกว่าวิกฤต (ตาราง) เอฟโต๊ะ, เช่น.
เอฟข้อเท็จจริง> เอฟตาราง =เอฟ(α;1,n-2),
จากนั้นสมมติฐาน H 0: β 1 =0 ถูกปฏิเสธ นัยสำคัญทางสถิติของสมการการถดถอยได้รับการยอมรับ เช่น มีความเชื่อมโยงระหว่างคุณลักษณะที่พิจารณาและผลลัพธ์ของการสังเกตไม่ขัดแย้งกับสมมติฐานของความเป็นเส้นตรง
ถ้า เอฟข้อเท็จจริงเอฟ ตาราง =เอฟ(α;1,n-2), ดังนั้นสมมติฐาน H 0 จะไม่ถูกปฏิเสธ สมการการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ
ค่าวิกฤต เอฟตาราง =เอฟ(α;1,n-2), ในระดับความสำคัญที่กำหนด α และจำนวนองศาอิสระ 1; n -2 ตั้งอยู่ตามตารางที่ 1 ของภาคผนวก
การประเมินนัยสำคัญของสมการถดถอยมักจะได้รับในรูปแบบของตารางการวิเคราะห์ความแปรปรวน
1. สำหรับ แบบจำลองการถดถอยการพึ่งพารายได้ทางการเงินเฉลี่ยต่อหัวของประชากร (รูเบิล, ที่) ของปริมาณผลิตภัณฑ์มวลรวมในภูมิภาค (พันรูเบิล x1) และอัตราการว่างงานในเรื่อง (%, x2) จะได้สมการ ค่าสัมประสิทธิ์การถดถอยสำหรับตัวแปร x2บ่งชี้ว่าหากการเปลี่ยนแปลงอัตราการว่างงาน 1% รายได้เงินสดเฉลี่ยต่อหัวคือ ______ รูเบิล โดยมีมูลค่าคงที่ของผลิตภัณฑ์มวลรวมในภูมิภาค
จะเปลี่ยนเป็น (-1.67)
จะเพิ่มขึ้น 1.67
ลดลง (-1.67)
จะเปลี่ยนเป็น 0.003
สารละลาย:
แบบจำลองทางเศรษฐมิติ สมการเชิงเส้นการถดถอยมีรูปแบบ ที่ไหน ยเป็นตัวแปรตาม เอ็กซ์ เจ -ตัวแปรอิสระ ( คือจำนวนของตัวแปรอิสระในแบบจำลอง เคคือ จำนวนตัวแปรอิสระทั้งหมดในแบบจำลอง) ก,บีเจ ยปัจจัยอื่นๆ ที่ไม่ใช่ตัวแปรอิสระในแบบจำลอง) ค่าสัมประสิทธิ์การถดถอยเป็นพารามิเตอร์ บีเจ. ค่าของมันแสดงให้เห็นว่าตัวแปรตามจะเปลี่ยนแปลงโดยเฉลี่ยเท่าใด ยเมื่อเปลี่ยนตัวแปรอิสระที่สอดคล้องกัน เอ็กซ์เจต่อ 1 หน่วยวัด ดังนั้น หากอัตราการว่างงานเปลี่ยนแปลง 1% รายได้เงินสดเฉลี่ยต่อหัวจะเปลี่ยนไป (-1.67) รูเบิล โดยผลิตภัณฑ์มวลรวมในภูมิภาคไม่เปลี่ยนแปลง
2. ในสมการการถดถอยพหุคูณเชิงเส้น: ต้นทุนของสินทรัพย์ถาวรอยู่ที่ไหน (พันรูเบิล) – จำนวนพนักงาน (พันคน) ย- ปริมาณ การผลิตภาคอุตสาหกรรม(พันรูเบิล) พารามิเตอร์พร้อมตัวแปร x1เท่ากับ 10.8 หมายความว่าเมื่อปริมาณสินทรัพย์ถาวรเพิ่มขึ้น _____ ปริมาณการผลิตภาคอุตสาหกรรมจะเป็น _____ โดยมีจำนวนพนักงานคงที่
สำหรับ 1,000 รูเบิล … จะเพิ่มขึ้น 10.8 พันรูเบิล
สำหรับ 1,000 รูเบิล … จะลดลง 10.8 พันรูเบิล
สำหรับ 1,000 รูเบิล …จะเพิ่มขึ้น 10.8%
1% …เพิ่มขึ้น 10.8%
สารละลาย:
ในสมการการถดถอยเชิงเส้นพหุคูณ พารามิเตอร์จะแสดงการเปลี่ยนแปลงโดยเฉลี่ยในผลลัพธ์ ยเมื่อปัจจัยเพิ่มขึ้นหนึ่งหน่วย โดยมีเงื่อนไขว่าตัวแปรอื่นๆ ทั้งหมดยังคงอยู่ที่ระดับคงที่ ในกรณีของเราคือปริมาณการผลิตภาคอุตสาหกรรม ยโดดเด่นด้วยสมการต่อไปนี้ พารามิเตอร์เท่ากับ 10.8 ดังนั้นเมื่อปริมาณสินทรัพย์ถาวรเพิ่มขึ้น 1,000 รูเบิล ปริมาณการผลิตภาคอุตสาหกรรมจะเพิ่มขึ้น 10.8 พันรูเบิล ด้วยจำนวนพนักงานที่สม่ำเสมอ
3. เป็นที่ทราบกันว่าสัดส่วนของความแปรปรวนคงเหลือของตัวแปรตามในความแปรปรวนทั้งหมดคือ 0.2 จากนั้นค่าสัมประสิทธิ์การตัดสินใจคือ ...
สารละลาย:
ค่าสัมประสิทธิ์การตัดสินใจ เท่ากับสัดส่วนของความแปรปรวนที่อธิบายโดยการถดถอยของความแปรปรวนทั้งหมด ค่า () แสดงส่วนแบ่งของความแปรปรวนคงเหลือในผลรวมหรือความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้คำนึงถึงในแบบจำลอง
. วิธี,
4. มีการสร้างแบบจำลองทางเศรษฐมิติเพื่อการพึ่งพาผลกำไรการขายหน่วยการผลิต (ถู., ที่) กับจำนวนเงินทุนหมุนเวียนขององค์กร (พันรูเบิล x1): . เพราะฉะนั้น, ขนาดเฉลี่ยกำไรจากการขายซึ่งไม่ได้ขึ้นอยู่กับปริมาณเงินทุนหมุนเวียนขององค์กรคือ _____ รูเบิล
สารละลาย:
แบบจำลองทางเศรษฐมิติของสมการการถดถอยคู่เชิงเส้นมีรูปแบบดังนี้ , ที่ไหน ยเป็นตัวแปรตาม เอ็กซ์-ตัวแปรอิสระ ก,ขเป็นพารามิเตอร์ของสมการ – ข้อผิดพลาดของแบบจำลอง (คำนึงถึงผลกระทบต่อตัวแปรตาม ยปัจจัยอื่นๆ ที่ไม่ใช่ตัวแปรอิสระในแบบจำลอง) ค่าพารามิเตอร์ กสามารถคำนวณได้โดยใช้สูตร ถ้าอย่างนั้น ; ในกรณีนี้เราบอกว่าค่าเฉลี่ยของตัวแปร ยโดยไม่ขึ้นกับค่าของตัวแปร เอ็กซ์เท่ากับค่าพารามิเตอร์ ก. ดังนั้นกำไรเฉลี่ยจากการขายซึ่งไม่ได้ขึ้นอยู่กับปริมาณเงินทุนหมุนเวียนขององค์กรคือ 10.75 รูเบิล
5. สถิติ F คำนวณเป็นอัตราส่วนของความแปรปรวน ______ ต่อความแปรปรวน _______ ที่คำนวณตามระดับความเป็นอิสระ
แฟกทอเรียล ... ตกค้าง
คงเหลือ...แฟกทอเรียล
แฟกทอเรียล ... ถึงทั่วไป
ที่เหลือ...รวม
สารละลาย:
เอฟ-สถิติคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อหนึ่งดีกรีอิสระ ต่อความแปรปรวนคงเหลือต่อหนึ่งดีกรีอิสระ
หัวข้อที่ 5: การประมาณค่าพารามิเตอร์ของสมการการถดถอยเชิงเส้น
1. สำหรับแบบจำลองทางเศรษฐมิติของสมการการถดถอย ข้อผิดพลาดของแบบจำลองถูกกำหนดเป็น ______ ระหว่างค่าจริงของตัวแปรตามและค่าที่คำนวณได้
ความแตกต่าง
ผลรวมของผลต่างกำลังสอง
ผลต่างกำลังสอง
ผลรวมของผลต่างของกำลังสอง
สารละลาย:
แบบจำลองทางเศรษฐมิติประเภทหนึ่งคือสมการถดถอย ซึ่งสามารถเขียนได้เป็น การแสดงออกทางคณิตศาสตร์, ที่ไหน ยเป็นตัวแปรตาม เอ็กซ์เจเป็นตัวแปรอิสระ ( เจ= 1,…, เค; เคคือจำนวนตัวแปรอิสระ) ฉ- พิมพ์ การพึ่งพาการทำงาน (ฟังก์ชันทางคณิตศาสตร์); เป็นปัจจัยสุ่ม ในกรณีนี้ ดังนั้น โดยที่ค่าที่แท้จริงของตัวแปรตาม คือค่าที่คำนวณได้ของตัวแปรตาม ซึ่งเป็นข้อผิดพลาดของโมเดล มาแสดงค่ากัน: . ดังนั้นคำตอบที่ถูกต้องคือ "ความแตกต่าง"
2.ค่าเรียกว่า...
องค์ประกอบแบบสุ่ม
การประมาณค่าพารามิเตอร์
ค่าพารามิเตอร์
ตัวแปร
สารละลาย:
ปริมาณนี้เรียกว่าองค์ประกอบแบบสุ่ม หรือการก่อกวน และรวมถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง ข้อผิดพลาดในการสุ่มตัวอย่าง และข้อผิดพลาดในการวัด
3. ในแบบจำลองเศรษฐมิติของสมการการถดถอย ค่าเบี่ยงเบนของค่าที่แท้จริงของตัวแปรตามจากค่าที่คำนวณได้จะแสดงลักษณะ ...