Hiện tượng đa cộng tuyến tiếng anh gọi là gì năm 2024
Was this document helpful? Show
Was this document helpful? 1 CHƯƠNG 6 HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY) 2
đa cộng tuyến
tuyến và biện pháp khắc phục MỤC TIÊU ĐA CỘNG TUYẾN NỘI DUNG 3 Bản chất, nguyên nhân của đa cộng tuyến 1 Ước lượng các tham số 2 3 Phát hiện đa cộng tuyến4 Khắc phục đa cộng tuyến 5 Hậu quả 4 Thu nhập Sự giàu có Chi tiêu 80 810 70 100 1009 65 120 1273 90 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 Nguồn: Ramu Ramanathan 5 6 1 2 3 4 5 6
0% found this document useful (0 votes) 65 views 15 pages Original TitleGujarati-2011-Chương-4-_-Chẩn-đoán-hồi-quy-Đa-cộng-tuyến Copyright© © All Rights Reserved Available FormatsPDF, TXT or read online from Scribd Share this documentDid you find this document useful?0% found this document useful (0 votes) 65 views15 pages Gujarati 2011 Chương 4 - Chẩn đoán hồi quy Đa cộng tuyếnJump to Page You are on page 1of 15 Reward Your CuriosityEverything you want to read. Anytime. Anywhere. Any device. No Commitment. Cancel anytime. Đa cộng tuyến là một hiện tượng thường gặp trong thống kê, và đôi khi có ảnh hưởng đến kết quả của thống kê. Vậy đa cộng tuyến là gì? Nguyên nhân và cách khắc phục nó như thế nào? Mời các bạn tham khảo bài viết dưới đây. Đa cộng tuyến là gì?Đa cộng tuyến ( tiếng Anh là Multicollinearity) là một thuật ngữ thống kê thường xảy ra khi có sự tương quan cao giữa hai hoặc nhiều biến độc lập trong mô hình hồi quy. Nói cách khác, một biến độc lập có thể được sử dụng để dự báo cho một hay nhiều biến độc lập khác. Chẳng hạn như ta có 2 biến độc lập “chiều cao” và “cân nặng”. Hiện tượng đa cộng tuyến xảy ra, tức là khi biến “chiều cao” tăng thì biến “cân nặng” tăng và ngược lại “chiều cao” giảm thì “cân nặng” cũng giảm. Điều này tạo ra thông tin dư thừa, làm sai lệch kết quả trong mô hình hồi quy. Hiện tượng này thường xảy ra phổ biến hơn đối với trong các nghiên cứu quan sát và ít gặp hơn với dữ liệu thử nghiệm. Ảnh hưởng mà đa cộng tuyến gây ra với mô hình hồi quyHiện tượng đa cộng tuyến không phải là vấn đề quá nghiêm trọng. Tuy nhiên, trong một số trường hợp thì nó lại gây ra rắc rối.
Nguyên nhân gây ra hiện tượng đa cộng tuyếnCó rất nhiều nguyên nhân gây ra hiện tượng đa cộng tuyến, nhưng sau đây là 2 nguyên nhân thường gặp nhất:
Ngoài ra, đa cộng tuyến có thể xảy ra do:
Cách phát hiện đa cộng tuyến trong SPSSCó hai cách để phát hiện hiện tượng đa cộng tuyến: dùng hệ số phóng đại phương sai VIF hoặc ma trận hệ số tương quan. Dựa vào hệ số phóng đại phương sai ( VIF)Hệ số phóng đại phương sai (Variance Inflation Factors) có chức năng đo lường mối tương quan và độ mạnh của mối tương quan giữa các biến dự báo trong mô hình hồi quy. Cách đơn giản nhất để có được hệ số VIF, ta thực hiện thao tác trên công cụ SPSS. Cách phân tích kết quả hệ số phóng đại phương sai trong SPSS:
Ngoài ra, ta cũng có thể xem xét giá trị Tolerance nằm ở bên trái V (với Tolerance = 1/VIF).
Dưới đây là một ví dụ cụ thể:Ví dụ: Giả sử chúng ta có tập dữ liệu sau cho biết điểm thi của 10 sinh viên cùng với số giờ họ đã học, số kỳ thi thử mà họ đã thực hiện và điểm hiện tại của họ trong khóa học: Trong đó, biến phụ thuộc là "score", các biến độc lập là "hours", "prep_exams" và "current_grade" Cách thực hiện:
Giải thích: Các giá trị VIF cho mỗi biến độc lập như sau:
Chúng ta có thể thấy rằng không có giá trị VIF nào cho các biến độc lập lớn hơn 5 => Không xảy ra đa cộng tuyến trong mô hình hồi quy này. Dựa vào hệ số tương quanMột cách dễ dàng để phát hiện đa cộng tuyến là tính toán hệ số tương quan cho tất cả các cặp biến độc lập. Nếu hệ số tương quan R chính xác là +1 hoặc -1, thì xảy ra hiện tượng đa cộng tuyến hoàn hảo. Nếu r gần hoặc chính xác là -1 hoặc +1 nên cân nhắc loại bỏ một trong các biến khỏi mô hình nếu có thể. Cách làm:
Biện pháp khắc phục tình trạng đa cộng tuyếnĐây là tình trạng thường xảy ra trong thống kê, nhưng nếu muốn khắc phục tình trạng này thì chúng ta phải làm sao? Thật không may, tình huống này có thể khó giải quyết. Có nhiều phương pháp mà bạn có thể thử, nhưng mỗi phương pháp đều có một số nhược điểm. Bạn cần phải sử dụng kiến thức và yếu tố trong từng lĩnh vực của mình trong các mục tiêu của nghiên cứu để chọn giải pháp kết hợp tốt nhất giữa ưu điểm và nhược điểm. Loại bỏ biến giải thích ra khỏi biến mô hình hồi quy
Thu thập thêm số liệu hoặc lấy mẫu mới hoàn toànVấn đề về đa cộng tuyến là đặc tính của mẫu, nhưng tùy theo mẫu khác nhau mà độ nghiêm trọng của đa cộng tuyến cũng khác nhau. Nên việc lấy mẫu khác có thể làm giảm mức độ nghiêm trọng của đa cộng tuyến. Thay đổi dạng mô hìnhDo trong kinh tế lượng có rất nhiều loại mô hình khác nhau nên có thể tái cấu trúc mô hình để khắc phục hiện tượng đa cộng tuyến. |