Kiểm Định Đa Cộng Tuyến Trong Stata

     

Đa cộng tuyến phát hiện với khắc phục dễ dãi với hồi quy Ridge, đấy là sai phạm cơ phiên bản và nhiều nhất đối với những nghiên cứu về lĩnh vực kinh tế; khi gặp vấn đề này thường thì bọn họ sẽ loại bỏ biến đó ra nhưng hôm nay chúng tôi phía dẫn chúng ta cách tự khắc phục công dụng nhất.

Bạn đang xem: Kiểm định đa cộng tuyến trong stata


ĐA CỘNG TUYẾN

Multicollinearity

Định nghĩa đa cộng tuyến

Trong thống kê lại , đa cộng đường (cũng là tính cộng tuyến đường ) là hiện tượng trong đó một đổi thay dự báo trong mô hình hồi quy bội số có thể được dự kiến tuyến tính từ những biến khác với tầm độ đúng chuẩn đáng kể. Trong trường vừa lòng này, các ước lượng hệ số của hồi quy bội gồm thể chuyển đổi thất thường để đáp ứng nhu cầu với phần nhiều thay đổi nhỏ trong quy mô hoặc dữ liệu.

Đa cộng con đường không làm cho giảm sức mạnh dự đoán hoặc độ tin cẩn của mô hình nói chung, ít nhất là vào tập tài liệu mẫu; nó chỉ ảnh hưởng đến các tính toán liên quan tiền đến những yếu tố dự đoán riêng lẻ. Nghĩa là, một quy mô hồi quy đa thay đổi với các yếu tố dự kiến cộng tuyến bao gồm thể cho biết toàn bộ nhóm các yếu tố dự báo dự đoán biến kết quả tốt ra sao , tuy vậy nó rất có thể không chuyển ra hiệu quả hợp lệ về ngẫu nhiên dự đoán trơ khấc nào hoặc về hầu như yếu tố dự đoán nào là dư quá so với những người dân khác.

Hệ quả của đa cùng tuyến

Nguy cơ chính của sự việc dư thừa dữ liệu như vậy là câu hỏi trang bị vô số trong các quy mô phân tích hồi quy . Các quy mô hồi quy tốt nhất là những quy mô trong đó các biến dự báo có đối sánh cao cùng với biến phụ thuộc vào (kết quả) tuy vậy chỉ đối sánh tối thiểu cùng với nhau. Một mô trong khi vậy thường xuyên được điện thoại tư vấn là “nhiễu thấp” và sẽ trẻ trung và tràn trề sức khỏe về phương diện thống kê (nghĩa là, nó sẽ dự kiến một cách an toàn trên những mẫu của những tập vươn lên là được đúc rút từ cùng một toàn diện và tổng thể thống kê).

Miễn là đặc điểm kỹ thuật cơ bạn dạng là bao gồm xác, nhiều cộng tuyến đường không thực thụ dẫn mang đến sai lệch; nó chỉ tạo thành sai số tiêu chuẩn chỉnh lớn trong những biến chủ quyền liên quan. Quan trọng đặc biệt hơn, cách thực hiện hồi quy thông thường là lấy những hệ số từ quy mô và kế tiếp áp dụng chúng cho những dữ liệu khác. Bởi đa cộng con đường gây ra các ước tính không chính xác về quý hiếm hệ số, các hiệu quả dự đoán không tính mẫu cũng biến thành không chính xác. Với nếu quy mô đa cộng đường trong tài liệu mới khác với mô hình trong tài liệu đã được điều chỉnh, thì phép nước ngoài suy như vậy hoàn toàn có thể gây ra sai số lớn trong số dự đoán.

Tuy nhiên, nếu thông số kỹ thuật cơ bạn dạng không không thiếu thốn và chủ yếu xác, thì đa cộng tuyến sẽ khuếch tán các lệch lạc về thông số kỹ thuật sai. Tuy vậy không thường xuyên được công nhận trong các văn bạn dạng về phương pháp, đó là một vấn đề phổ cập trong công nghệ xã hội chỗ mà một sệt tả đầy đủ, đúng chuẩn của mô hình hồi quy OLS hiếm khi được nghe biết và ít nhất một số trong những biến gồm liên quan sẽ không còn thể quan gần cạnh được. Kết quả là, các hệ số cầu tính của các biến độc lập có tương quan trong một hồi quy OLS đã bị xô lệch bởi đa cùng tuyến. Khi mối đối sánh tương quan tiến gần đến một, những ước lượng hệ số sẽ sở hữu xu hướng lệch lạc về độ to vô hạn theo những hướng ngược lại, trong cả khi tác động ảnh hưởng thực sự của các biến là nhỏ và thuộc dấu.

Cách phạt hiện

Những thay đổi lớn trong hệ số hồi quy cầu tính khi 1 biến dự báo được cấp dưỡng hoặc xóaHệ số hồi quy không đáng kể cho các biến bị ảnh hưởng trong hồi quy bội, nhưng bác bỏ trả thuyết chung rằng những hệ số này đều bằng 0 (sử dụng F -test )Nếu một hồi quy đa biến tìm thấy một hệ số không đáng chú ý của một trình phân tích và lý giải cụ thể, tuy nhiên một hồi quy tuyến tính dễ dàng của vươn lên là được giải thích trên biến lý giải này cho biết thêm hệ số của nó khác 0 đáng kể, tình huống này đã cho thấy tính nhiều cộng tuyến trong hồi quy đa biến.Một số tác giả đã đề xuất một dung không đúng phát hiện ưng thuận hoặc hệ số lạm phát phương sai (VIF) mang lại đa cùng tuyến: tolerance = 1 – R2 , VIF = 1 / tolerance ; ở chỗ nào là hệ số khẳng định hồi quy của giải thích trên tất cả các lý giải khác. Dung sai nhỏ dại hơn 0,20 hoặc 0,10 cùng / hoặc VIF từ bỏ 5 hoặc 10 trở lên cho thấy thêm vấn đề đa cộng tuyến.Kiểm định Farrar – Glauber : Nếu những biến được tra cứu thấy là trực giao, thì không tồn tại đa cùng tuyến; nếu các biến không trực giao thì không nhiều nhất cũng có hiện tượng đa cộng tuyến ở 1 mức độ nào đó. C. Robert Wichers sẽ lập luận rằng kiểm định đối sánh từng phần Farrar – Glauber không công dụng ở chỗ một đối sánh tương quan từng phần độc nhất định có thể tương ưa thích với những mẫu nhiều cộng con đường khác nhau. Thí điểm Farrar – Glauber cũng trở nên các nhà nghiên cứu và phân tích khác chỉ trích.Kiểm tra số đk : Thước đo tiêu chuẩn chỉnh của đk kém trong ma trận là chỉ số điều kiện. Nó sẽ cho là sự nghịch hòn đảo của ma trận không ổn định về mặt số học với các số có độ chính xác hữu hạn (máy tính tiêu chuẩn nổi và tăng gấp hai ). Điều này cho thấy thêm độ tinh tế tiềm năng của nghịch hòn đảo được thống kê giám sát đối với đều thay đổi bé dại trong ma trận ban đầu. Số đk được tính bằng cách tìm căn bậc hai của quý giá riêng lớn số 1 chia cho giá trị riêng nhỏ tuổi nhất của ma trận thiết kế. Nếu số đk trên 30, hồi quy hoàn toàn có thể có đa cộng con đường nghiêm trọng; đa cộng con đường tồn trên nếu, kế bên ra, hai hoặc nhiều biến tương quan đến số đk cao có tỷ lệ phương sai cao được giải thích. Một ưu điểm của cách thức này là nó cũng cho thấy thêm những đổi mới nào đang gây nên sự cố.Thúc đẩy dữ liệu . Đa cùng tuyến có thể được vạc hiện bằng phương pháp thêm nhiễu thốt nhiên vào tài liệu và chạy lại hồi quy các lần và xem những hệ số chuyển đổi bao nhiêu.Việc tạo ma trận tương quan giữa các biến giải thích sẽ mang đến dấu hiệu về khả năng rằng bất kỳ cặp phát triển thành nào bên đề nghị nhất định đều tạo thành các vụ việc đa cộng tuyến. Các giá trị tương quan (các thành phần nằm đi ngoài đường chéo) ít nhất là 0,4 thỉnh thoảng được hiểu là chỉ ra rằng một vụ việc đa cộng tuyến. Tuy nhiên, quá trình này khôn cùng có sự việc và không thể được khuyến khích. Về khía cạnh trực quan, sự tương quan mô tả một mối quan hệ hai biến, trong khi cộng tuyến là 1 trong hiện tượng đa biến.

Xem thêm: Phiếu Bài Tập Cuối Tuần 13 Lớp 4, Đề 2 (Có Đáp Án Và Lời Giải Chi Tiết)

Cách tự khắc phục

Đảm nói rằng bạn không lâm vào cảnh bẫy thay đổi giả ; gồm 1 biến giả đến mọi danh mục (ví dụ: mùa hè, mùa thu, mùa đông và mùa xuân) và gồm một số hạng không đổi trong hồi quy thuộc nhau đảm bảo an toàn đa cộng con đường hoàn hảo.Hãy thử xem điều gì sẽ xảy ra nếu như khách hàng sử dụng các tập đúng theo con tự do của dữ liệu để cầu tính và vận dụng những ước tính đó cho tổng thể tập dữ liệu. Về mặt lý thuyết, bạn sẽ có được phương sai cao hơn một chút từ những tập dữ liệu nhỏ dại hơn được áp dụng để cầu tính, tuy nhiên kỳ vọng của những giá trị thông số phải tương đương nhau. Đương nhiên, những giá trị hệ số quan gần kề sẽ khác nhau, tuy vậy hãy coi chúng thay đổi bao nhiêu.Giữ nguyên tế bào hình, bỏ mặc đa cùng tuyến. Sự hiện diện của đa cộng đường không tác động đến tác dụng của việc ngoại suy tế bào hình cân xứng với dữ liệu mới với đk là những biến đoán trước tuân theo thuộc một chủng loại đa cộng tuyến trong tài liệu mới như trong dữ liệu dựa trên mô hình hồi quy.Bỏ một trong những biến. Một biến giải thích có thể bị nockout bỏ để tạo nên một quy mô có hệ số quan trọng. Tuy nhiên, các bạn mất thông tin (vì bạn đã vứt một biến). Việc bỏ sót một biến có tương quan dẫn đến mong tính thông số chệch cho các biến lý giải còn lại có đối sánh với biến bị nockout bỏ.Lấy thêm dữ liệu, nếu có thể. Đây là giải pháp được ưu tiên. Nhiều tài liệu hơn có thể tạo ra các ước tính tham số đúng mực hơn (với sai số tiêu chuẩn thấp hơn), như được thấy từ cách làm trong hệ số lạm phát phương sai mang đến phương không đúng của ước tính hệ số hồi quy về kích cỡ mẫu và mức độ đa cộng tuyến.Làm trung tâm các biến dự báo. Tạo những số hạng nhiều thức hoặc các luật pháp tương tác có thể gây ra một số đa cộng con đường nếu trở nên được đề cập bao gồm một phạm vi giới hạn (ví dụ:. Lấy ý nghĩa làm trung chổ chính giữa sẽ vứt bỏ loại đa cùng tuyến đặc biệt quan trọng này. Mặc dù nhiên, nói chung, điều này không có tác dụng. Nó có thể hữu ích trong bài toán khắc phục các vấn đề phạt sinh từ việc làm tròn số và công việc tính toán khác nếu như chương trình laptop được thiết kế cẩn thận không được sử dụng.Chuẩn hóa các biến chủ quyền của bạn. Điều này hoàn toàn có thể giúp giảm vấn đề gắn cờ sai mang đến chỉ số đk trên 30.Người ta cũng nhắc nhở rằng thực hiện giá trị Shapley , một công cụ lý thuyết trò đùa , mô hình có thể giải thích những tác hễ của đa cùng tuyến. Cực hiếm Shapley chỉ định một giá trị cho từng dự đoán và review tất cả những kết hợp hoàn toàn có thể có về mức độ quan trọng.Có thể áp dụng hồi quy Ridge hoặc hồi quy thành phần chính hoặc hồi quy bình phương nhỏ nhất từng phần(PLS) .Nếu các lý giải tương quan liêu là các giá trị trễ khác biệt của cùng một trình lý giải cơ bản, thì rất có thể sử dụng nghệ thuật trễ phân tán , áp đặt cấu trúc chung cho các giá trị tương đối của các hệ số được mong tính.

Ứng dụng thực tế

Kiểm tra đa cùng tuyến

Trong triết lý thường nó nêu ra siêu nhiều, nhưng lại trong thực tế phân tích thì chúng ta chỉ buộc phải kiểm tra bằng hệ số VIF với khắc phục không nên phạm đa cộng tuyến bởi hồi quy Ridge thôi; hiện thời chúng ta sẽ kiểm soát đa cộng tuyến trên những phần mềm thông dụng hiện nay nay

Stata

Trong phần mềm Stata chúng ta chạy hồi quy bình thường, ngừng rồi gõ lệnh vif nó sẽ kiểm tra đa cộng tuyến cho việc đó ta, cùng có tác dụng như sau:

*
Kiểm tra nhiều cộng con đường trên Stata

Chúng ta điều tất cả 3 vươn lên là bị đa cộng tuyến

Eviews

Tiếp theo chúng ta sẽ test chạy ứng dụng Eviews xem kết quả như cầm cố nào ?

*
Cách bình chọn đa cộng tuyến trên Eviews

Kết quả cho ta cả 3 biến đổi điều bị đa cùng tuyến

SPSS

Khi kiểm tra trên SPSS bọn họ vẫn có công dụng như vậy,

*
Kiểm tra nhiều cộng con đường trên SPSSMinitab

Còn 1 phần mềm thống dụng nữa, chúng ta kiểm tra luôn xem sao

*
Kiểm tra nhiều cộng tuyến đường trên MinitabNCSS

Nói chúng là đa phần những phần mềm thống kê điều có chức năng kiểm tra đa cộng tuyến đường trong hồi quy con đường tính, bạn có thể sử dụng bắt cứ ứng dụng nào mà chúng ta tiện nhất bao gồm thể; Giờ shop chúng tôi kiểm tra nhiều cộng tuyến đường thêm trên phần mềm thống kê NCSS, vì họ dùng nó để khắc phục không đúng phạm, nên phải soát sổ nó thôi.

*
Kiểm tra nhiều cộng tuyến trên NCSS

Khắc phục đa cộng tuyến bởi hồi quy Ridge

Thông thường để khắc phục đa cùng tuyến chúng ta thường áp dụng phần mêm thống kê lại R, đây là phần mượt thống kê rất mạnh và luôn có những update mới độc nhất về thống kê; Tính mới luôn luôn luôn hơn hẳn những ứng dụng thương mại, dẫu vậy nhược điểm của chính nó là câu lệnh, nên sự việc học đòi hỏi thời gian lâu và dài.

Rất may mắn, họ có ứng dụng với đồ họa đồ hoạ liên hệ mà gồm hồi quy ridge. Chạy hồi quy ridge bên trên NCSS thôi

*
Kết quả hồi quy Ridge trên NCSS

Ta có thông số hiệu chỉnh k=0.01 thì toàn bộ các biến trong tế bào hình không bị đa cùng tuyến.

Xem thêm: Phương Pháp Bảo Toàn Nguyên Tố Là Gì ? Học Ở Lớp Mấy ? Kèm Ví Dụ Giải Chi Tiết

Kết luận

Nếu các bạn có trở ngại nào trong bài toán khắc phục không nên phạm đa cộng tuyến, hãy contact ngay với cửa hàng chúng tôi được hỗ trợ tư vấn và hỗ trợ kịp thời nhất.