Cách tính hiệp phương sai trong xác suất thống kê
Cùng viết bởi Nhân viên của wikiHow Show Tham khảo X Bài viết này có đồng tác giả là đội ngũ biên tập viên và các nhà nghiên cứu đã qua đào tạo, những người xác nhận tính chính xác và toàn diện của bài viết. Phương sai đo lường độ phân tán của bộ dữ liệu. Nó rất hữu dụng trong việc xây dựng các mô hình thống kê: phương sai thấp có thể là dấu hiệu cho thấy bạn đang mô tả lỗi ngẫu nhiên hay nhiễu thay vì mối quan hệ ẩn chứa trong dữ liệu. Với bài viết này, wikiHow sẽ hướng dẫn bạn cách tính phương sai. Các bướcPhương pháp 1 của 2:Tính phương sai của một mẫu1Viết bộ dữ liệu mẫu của bạn. Trong hầu hết trường hợp, các nhà thống kê chỉ có được thông tin của một mẫu, hay tập con của tổng thể mà họ đang nghiên cứu. Chẳng hạn như, thay vì phân tích tổng thể "chi phí của mọi xe hơi ở Đức", một nhà thống kê có thể tìm chi phí của một mẫu ngẫu nhiên với quy mô vài nghìn xe hơi. Nhà thống kê ấy có thể dùng mẫu này để có ước lượng tốt về chi phí xe hơi ở Đức. Tuy nhiên, nhiều khả năng nó sẽ không trùng khớp hoàn toàn với những con số thực tế.
2Viết công thức phương sai mẫu. Phương sai của một bộ dữ liệu cho biết mức độ phân tán của các điểm dữ liệu. Phương sai càng gần không, các điểm dữ liệu càng nhóm lại gần nhau. Khi làm việc với bộ dữ liệu mẫu, hãy sử dụng công thức tính phương sai sau:[1] X Nguồn nghiên cứu Đi tới nguồn = [( - x̅) ]/(n - 1) là phương sai. Phương sai luôn được tính bằng đơn vị bình phương. đại diện cho một giá trị trong bộ dữ liệu của bạn.
, rồi cộng chúng với nhau.
3Tính giá trị trung bình của mẫu. Biểu tượng x̅ hay "x-ngang" được dùng để chỉ giá trị trung bình của mẫu.[2] X Nguồn nghiên cứu Đi tới nguồn Hãy tính như cách mà bạn sẽ làm với mọi giá trị trung bình: cộng tất cả các điểm dữ liệu và lấy tổng chia cho số điểm.
4Lấy từng điểm dữ liệu trừ đi giá trị trung bình. Giờ là lúc để tính - x̅, trong đó là từng điểm trong bộ dữ liệu của bạn. Mỗi kết quả thu được sẽ cho biết độ lệch so với giá trị trung bình của mỗi điểm tương ứng, hay nói một cách đơn giản, khoảng cách từ nó đến giá trị trung bình.[3] X Nguồn nghiên cứu Đi tới nguồn .
- x̅ = 17 - 14 = 3 - x̅ = 15 - 14 = 1 - x̅ = 23 - 14 = 9 - x̅ = 7 - 14 = -7 - x̅ = 9 - 14 = -5 - x̅ = 13 - 14 = -1
5Bình phương mọi kết quả. Như lưu ý ở trên, danh sách độ lệch hiện tại ( - x̅) có tổng bằng 0. Nghĩa là "độ lệch trung bình" cũng sẽ luôn bằng 0 và không thể nói lên điều gì về mức độ phân tán của dữ liệu. Để giải quyết vấn đề này, ta tìm bình phương từng độ lệch. Nhờ đó, tất cả đều là số dương, giá trị âm và giá trị dương không còn triệt tiêu nhau và cho tổng bằng 0 nữa.[4] X Nguồn nghiên cứu Đi tới nguồn
- x̅) - x̅)
- x̅) cho từng điểm dữ liệu trong mẫu. 6Tìm tổng của các giá trị bình phương. Giờ là lúc để tính toàn bộ tử số của công thức: [( - x̅) ]. Xích-ma lớn, , yêu cầu bạn cộng giá trị phần tử theo sau cho từng giá trị . Bạn đã tính ( - x̅) cho từng giá trị trong mẫu, do đó, những gì mà bạn phải làm chỉ là cộng các kết quả với nhau.
7Chia cho n - 1, trong đó n là số điểm dữ liệu. Rất lâu về trước, khi tính phương sai mẫu, các nhà thống kê chỉ chia cho n. Phép chia đó sẽ cho bạn giá trị trung bình của độ lệch bình phương, trùng khớp hoàn toàn với phương sai của mẫu đó. Tuy nhiên, hãy nhớ rằng mẫu chỉ là ước lượng của một tổng thể lớn hơn. Nếu lấy một mẫu ngẫu nhiên khác và thực hiện tính toán tương tự, bạn sẽ có kết quả khác. Hóa ra, chia cho n -1 thay vì n lại cho bạn ước tính tốt hơn về phương sai của tổng thể lớn hơn điều mà bạn thật sự quan tâm. Phép hiệu chỉnh này phổ biến đến mức giờ đây, nó đã là định nghĩa được chấp nhận của phương sai mẫu.[5] X Nguồn nghiên cứu Đi tới nguồn
33,2 8Hiểu phương sai và độ lệch chuẩn. Lưu ý rằng, bởi có lũy thừa trong công thức, phương sai được đo lường bằng bình phương đơn vị tính của dữ liệu gốc. Điều này gây khó hiểu về mặt trực quan. Thay vì vậy, thường thì độ lệch chuẩn lại khá hữu dụng. Nhưng bạn cũng không hề phí công vô ích, bởi độ lệch chuẩn được xác định bằng căn bậc hai của phương sai. Đó là lý do phương sai mẫu được viết dưới dạng , và độ lệch chuẩn của một mẫu chính là .
Phương pháp 2 của 2:Tính phương sai của một tổng thể1Bắt đầu với bộ dữ liệu tổng thể. Thuật ngữ "tổng thể" được dùng để chỉ toàn bộ bộ quan sát liên quan. Chẳng hạn như, nếu đang nghiên cứu tuổi cư dân Hà Nội, tổng thể của bạn sẽ bao gồm tuổi của mọi cá nhân sinh sống ở Hà Nội. Thường thì bạn sẽ tạo bảng tính cho bộ dữ liệu lớn như vầy, nhưng đây là bộ dữ liệu ví dụ nhỏ hơn:
2Viết công thức phương sai tổng thể. Bởi tổng thể chứa toàn bộ dữ liệu ta cần, công thức này cho ta phương sai chính xác của tổng thể. Để phân biệt với phương sai mẫu (vốn chỉ là một ước tính), các nhà thống kê sử dụng các biến khác:[6] X Nguồn nghiên cứu Đi tới nguồn
= (( - μ) )/n
= phương sai mẫu. Đây là xích-ma thường bình phương. Phương sai được đo lường bằng bình phương đơn vị tính. đại diện cho một phần tử trong bộ dữ liệu của bạn.
, và rồi được cộng lại.
3Tìm giá trị trung bình của tổng thể. Khi phân tích tổng thể, ký hiệu μ ("mu") đại diện cho trung bình số học. Để tìm giá trị trung bình, cộng toàn bộ các điểm dữ liệu, sau đó chia cho số các điểm.
= 10,5 4Lấy từng điểm dữ liệu trừ đi giá trị trung bình. Điểm dữ liệu gần với giá trị trung bình có chênh lệch gần không hơn. Lặp lại bài toán trừ cho toàn bộ các điểm dữ liệu, và có lẽ bạn sẽ bắt đầu cảm nhận được mức độ phân tán của dữ liệu.
- μ = 5 10,5 = -5,5 - μ = 5 10,5 = -5,5 - μ = 8 10,5 = -2,5 - μ = 12 - 10., = 1,5 - μ = 15 10,5 = 4,5 - μ = 18 10,5 = 7,5 5Bình phương từng hiệu. Lúc này, một số kết quả thu được từ bước trước sẽ âm và một số sẽ dương. Nếu hình dung dữ liệu trên một đường đẳng số, hai hạng mục này đại diện cho các số nằm ở bên trái và bên phải của giá trị trung bình. Điều này sẽ chẳng có lợi gì trong việc tính phương sai, bởi hai nhóm này sẽ triệt tiêu lẫn nhau. Thay vì vậy, hãy bình phương toàn bộ để chúng đều dương.
- μ) với mỗi giá trị của i chạy từ 1 đến 6: = 30,25 = 30,25 = 6,25 = 2,25 = 20,25 = 56,25 6Tìm trung bình kết quả thu được của bạn. Lúc này, bạn đã có giá trị cho từng điểm dữ liệu, liên quan (không trực tiếp) đến việc điểm dữ liệu đó cách giá trị trung bình bao xa. Hãy lấy trung bình bằng cách cộng chúng với nhau rồi chia cho số giá trị mà bạn có.
24,25 7Liên hệ với công thức. Nếu không chắc điều này phù hợp thế nào với công thức được nêu ở đầu phương pháp, hãy viết tay cả bài toán, và đừng viết tắt:
- μ) , ( - μ) , và tương tự cho đến ( - μ) , trong đó là điểm dữ liệu cuối cùng trong bộ dữ liệu.
- μ) + ( - μ) + ... + ( - μ) ) / n
- μ) )/n, công thức phương sai. Lời khuyên
Video liên quan |