Bài tập hệ số tương quan có lời giải

  1. Thực hiện trên phần mềm R bài tập sau về tính hệ số tương quan và tính toán hàm hồi quy thực nghiệm:

Bài 1. Một mẫu quan sát của đại lượng ngẫu nhiên hai chiều [ X; Y ] có giá trị như sau [2 ; 1; 4 ; 12] ; [2 ; 2; 4 ; 34] ; [2 ; 4; 4 ; 56] ; [2 ; 5; 4 ; 63] [2 ; 25; 4 ; 38] ; [2 ; 45; 4 ; 75] ; [2 ; 16; 4 ; 4] ; [2 ; 34; 4 ; 62] a] Hãy tính hệ số tương quan thực nghiệm của mẫu trên. b] Hãy xây dựng hàm hồi quy tuyến tính của Y theo X_._

Các thao tác cụ thể cần thực hiện với R :

  1. Nhập biến X

\> bienX bienY cor [bienX, bienY]

Xác nhận kết quả sau trên màn hình [1] 0.

\>

  1. Ước lượng các hệ số hồi quy theo cú pháp

\> lm[bienY ~ bienX]

Xác nhận kết quả sau trên màn hình

lm[formula = bienY ~ bienX]

Coefficients:

[Intercept] bienX

1 1.

\>

Các thông tin cần nắm được khi thực hiện:

  1. Cách nhập các biến X, Y.
  2. Ký hiệu cor trong lệnh cor [bienX, bienY] nghĩa là hệ số tương quan [coefficient of correlation]. Công thức của hệ số này là
  3. Giá trị nhận được từ R là [1] 0. là giá trị tính được của hệ số tương quan r.
  4. Ký hiệu lm trong lệnh lm[bienY ~ bienX] nghĩa là mô hình tuyến tính [ l inear m odel]. Ký hiệu bienY ~ bienX có nghĩa là mô tả bienY như một hàm số của bienX. Công thức tính toán của mô hình là

với , là hai hệ số hồi quy thực nghiệm được ước lượng theo công thức

  1. Kết quả được xác định từ R là

Coefficients:

[Intercept] bienX

1 1. có nghĩa là R tính ra được và. Nói cách khác hàm hồi quy thực nghiệm được đưa ra là .

Trình bày lời giải của bài toán ra giấy sau các tính toán thực hành trên R [ áp dụng cho việc kiểm tra ]:

Công thức tính hệ số tương quan là

Kết quả tính toán thực nghiệm là r =0,9098077 [sử dụng R]

Công thức tính các hệ số hồi quy tuyến tính là

Kết quả tính toán thực nghiệm là và [sử dụng R].

Sinh viên có thể sử dụng các công thức tương đương để trình bày trong lời giải và cần giải thích được các ký hiệu , trong lời giải trên.

Thực hành giải các bài tập sau bằng R

Kết quả đối chiếu

  1. Kết quả tính hệ số tương quan thực nghiệm r [1] 0.
  2. Kết quả tính các hệ số hồi quy , lm[formula = tgian1 ~ kcach] Coefficients: [Intercept] kcach 4 4.

II. Thực hiện trên phần mềm R bài tập về xác định hàm hồi quy và ước lượng giá trị dự báo:

Bài 5. Số liệu về dân số [tính theo nghìn người] thành phố Hồ Chí Minh trong các năm gần đây được thống kê như sau:

Năm 2011 2012 2013 2014 2015 2016 Số dân

7498, 4

7660, 3

7820, 0

7981, 9

8146, 3

8320, 1 a] Hãy tìm hàm xu thế tuyến tính biểu thị dân số của thành phố Hồ Chí Minh. b] Vẽ hình mô tả dữ liệu [biểu đồ phân tán] và đồ thị hàm hồi quy tuyến tính thực nghiệm. c] Xác định sai số của dữ liệu được cung cấp và hàm hồi quy thực nghiệm tại các điểm quan sát. d] Dự báo số dân năm 2017 của thành phố này và tìm khoảng tin cậy 98% cho giá trị đó.

Các thao tác cụ thể cần thực hiện với R :

  1. Nhập biến thời gian

\> tgian danso lm[danso ~ tgian]

Xác nhận kết quả sau trên màn hình

Call: lm[formula = danso ~ tgian] Coefficients:

[Intercept] tgian -321624 163.

  1. Vẽ biểu đồ miêu tả dữ liệu [biểu đồ phân tán] được cung cấp theo câu lệnh > plot [tgian, danso]

Xác nhận hình ảnh được R đưa ra

  1. Tạo object chứa các thông tin về hồi quy trong R theo lệnh > reg abline[reg]

Xác nhận hình ảnh được R đưa ra

  1. Đọc giá trị của từ R theo câu lệnh

\>y0mu

Xác nhận kết quả được R đưa ra

[Intercept]

8477.

  1. Tính giá trị theo các câu lệnh

\> n sbp sbp

Xác nhận kết quả được R đưa ra

[1] 23.

  1. Tính và theo các câu lệnh sau

\> xtb Sxx xtb

[1] 2013.

\> Sxx

[1] 17.

  1. Định nghĩa biến “phân vị” để ghi lại giá trị

\> phanvi phanvi

[1] 3.

  1. Tính bán kính khoảng ước lượng theo các câu lệnh

bkinh bkinh

[1] 16.

  1. Tính khoảng ước lượng theo câu lệnh

\> y0mu+c[-1,1]*bkinh

và xác nhận kết quả từ R [1] 8460 8494.

Trình bày lời giải các ý a và d của bài toán ra giấy sau các tính toán thực hành trên R [ áp dụng cho việc kiểm tra ]:

  1. Công thức tính các hệ số hồi quy tuyến tính là

Kết quả tính toán thực nghiệm là và [sử dụng R]

  1. Thời điểm ước lượng dân số của TP Hồ Chí Minh là

Sai lệch giữa giá trị quan sát và hàm hồi quy > resid [reg] 1 2 3 4 -1 -0 2 0. 5 6 7 -0 -0 -0. 3. Điểm ước lượng cho lượng vận chuyển của công ty vận tải tại thời điểm được lựa chọn là > y0mu [Intercept] 43. 4. Kết quả tính các biến trong công thức độ tin cậy > xtb [1] 2013 > Sxx [1] 28 > sbp [1] 1. 5. Phân vị và bán kính khoảng ước lượng > phanvi [1] 2. > bkinh [1] 2. 6. Khoảng tin cậy 95% cho lượng vận chuyển của công ty vận tải tại thời điểm được lựa chọn là

\> y0mu+c[-1,1]*bkinh

[1] 41 46.

Bài 7. Phân tích chi phí bảo dưỡng cho xe tải trong 8 năm sử dụng đầu tiên [tính theo triệu đồng] ta có kết quả:

Năm thứ 1 2 3 4 5 6 7 8 Chi phí TB 6

8, 2

8, 7

10, 5

1 2

14, 4

1 7

19, 2 a] Hãy tìm hàm xu thế tuyến tính biểu thị chi phí bảo dưỡng xe. b] Vẽ hình mô tả dữ liệu và đồ thị hàm hồi quy tuyến tính thực nghiệm. c] Xác định sai số của dữ liệu được cung cấp và hàm hồi quy thực nghiệm tại các điểm quan sát. d] Dự báo chi phí bảo dưỡng trung bình cho xe trong năm sử dụng thứ 10 và tìm khoảng tin cậy 90% cho giá trị đó.

Kết quả đối chiếu

  1. Kết quả tính các hệ số hồi quy , Call: lm[formula = chiphi ~ tgian] Coefficients: [Intercept] tgian 3 1.
  2. Hình ảnh của các mô tả trực quan

Sai lệch giữa giá trị quan sát và hàm hồi quy > resid [reg] 1 2 3 4 5 0 0 -0 -0 -0. 6 7 8 -0 0 0. 3. Điểm ước lượng cho lượng vận chuyển của công ty vận tải tại thời điểm được lựa chọn là

  1. Tìm đường hồi quy tuyến tính biểu diễn điểm thống kê theo điểm giải tích. b] Vẽ biểu đồ phân tán và đường hồi quy tuyến tính thực nghiệm. Dựa vào đồ thị để nhận xét về quan hệ giữa điểm của hai môn học.

Bài 10. Quảng cáo được xem là chìa khóa dẫn đến thành công. Để đánh giá hiệu quả của quảng cáo đến doanh thu, nhà quản lý của một chuỗi cửa hàng bán lẻ thu thập dữ liệu về doanh thu và chi phí dành cho quảng cáo [đơn vị: triệu đồng] từ các cửa hàng trong n = 8 tuần gần nhất. Dữ liệu được ghi lại trong bảng dưới đây.

Chi phí QC 3,0 7,0 6,5 3,5 4,5 7,0 7,5 8, Doanh thu 50 200 150 75 100 180 190 210 a] Hãy tính hệ số tương quan mẫu. b] Hãy tìm hồi quy tuyến tính biểu diễn doanh thu qua chi phí quảng cáo. c] Vẽ hình biểu đồ phân tán và đồ thị hàm hồi quy tuyến tính thực nghiệm. d] Xác định sai số của dữ liệu được cung cấp và hàm hồi quy thực nghiệm tại các điểm quan sát. e] Dự báo doanh thu đạt được trung bình ứng với chi phí quảng cáo 11 triệu và tìm khoảng tin cậy 95% cho giá trị đó.

Hệ số tương quan bao nhiêu là tốt?

Giá trị của hệ số tương quan bằng 0.2 nghĩa là mối quan hệ giữa hai biến là đồng biến. Tuy nhiên mức độ trong quan hệ của hai biến ở mức không đáng kể. Các chuyên gia đã nhận định rằng tương quan giữa hai biến sẽ có ý nghĩa khi đạt giá trị từ 0.8 trở lên. Từ 0.9 trở lên là mối liên hệ rất chặt chẽ.

Hệ số tương quan r có ý nghĩa gì?

Hệ số tương quan Pearson [Pearson correlation coefficient, ký hiệu r] là số liệu thống kê kiểm tra đo lường mối quan hệ thống kê hoặc liên kết giữa các biến phụ thuộc với các biến liên tục.

Nếu hệ số tương quan r 0 thì có kết luận gì về giá trị A và B?

Nếu mối tương quan giữa hai biến là 0 thì kết luận không có mối quan hệ tuyến tính giữa chúng. Độ mạnh của mối quan hệ thay đổi theo mức độ dựa trên giá trị của hệ số tương quan. Ví dụ, giá trị 0,2 cho thấy có mối tương quan dương giữa hai biến, nhưng nó yếu và có thể không quan trọng.

Hệ số tương quan Correlation bao nhiêu thì được gọi là mảnh strong?

Tuy nhiên, hệ số tương quan với giá trị tuyệt đối là 0,9 hoặc lớn hơn sẽ thể hiện mối quan hệ rất mạnh mẽ.

Chủ Đề