So sánh số mắc trong spss năm 2024

Tiếp theo bài so sánh hôm trước, bài viết này giới thiệu cách so sánh giữa hai nhóm đối tượng khi biến cần so sánh ở dạng scale. Ví dụ cụ thể như sau:

Tôi muốn biết giữa Nam và Nữ có sự khác biệt về mức độ tham gia hoạt động Câu lạc bộ tiếng Anh ở trường hay không. Tôi đã thiết kế bảng câu hỏi như sau:

Hãy đánh dấu chéo vào câu trả lời của bạn cho các câu hỏi bên dưới:

Q1. Giới tính của bạn: Nam/Nữ

Q2. Khi trường bạn tổ chức Câu lạc bộ Tiếng Anh, bạn tham gia ở mức độ nào:

Luôn luôn tham gia Thường tham gia Thỉnh thoảng tham gia Ít khi tham gia
  • Hiếm khi hoặc không bao giờ

Sau đó tôi phát bảng câu hỏi này cho 300 bạn sinh viên trong trường chẳng hạn. Thu kết quả về, tôi nhập liệu như sau. Đối với câu 1, nếu là Nam, tôi nhập 1; nếu là Nữ, tôi nhập 2. Đối với câu 2, tôi nhập từ 5 đến 1, tương ứng với thứ tự như trong bảng câu hỏi. Nghĩa là nếu câu trả lời là Luôn luôn tham gia, thì tôi nhập 5; còn nếu Ít khi tham gia thì tôi nhập 2. Kết quả, tôi sẽ có bảng số liệu như sau:

Thẻ Variable View

So sánh số mắc trong spss năm 2024

Để ý trong thẻ Variable View này tôi chọn Measure cho Q2 là Scale vì những giá trị từ 1 đến 5 cho biến này có quan hệ tương đối với nhau.

Thẻ Data View ứng với 8 đối tượng tham gia đầu tiên:

So sánh số mắc trong spss năm 2024

Sau khi đã nhập liệu đầy đủ đối với 300 đối tượng. Tôi tiến hành thực hiện t-test. Sở dĩ tôi chọn t-test trong trường hợp này là vì tôi có 2 nhóm (Nam và Nữ) và một biến với data ở dạng scale cần để so sánh.

Tiến hành thực hiện t-test như sau. Trong SPSS 18, Analyze - Compare Means - Independent Samples T-Test. Khung t-test sẽ hiện ra. Sau đó tôi sẽ di chuyển biến cần so sánh vào ô Test Variable(s) ở phía trên. Trường hợp này là Q2. Rồi tôi di chuyển biến về nhóm vào ô Grouping Variable bên dưới. Trường hợp này là Q1. Sau đó tôi định nghĩa giá trị cho 2 nhóm trong ô Grouping Variable bằng cách nhấn nút Define Groups ngay bên dưới. Trong ô Group 1 tôi điền 1 (Giá trị tương ứng với Nam) và trong ô Group 2 tôi điền 2 (Giá trị tương ứng với Nữ). Sau đó nhấn Continue. Xem hình bên dưới.

So sánh số mắc trong spss năm 2024

Sau đó tôi tiếp tục nhấn vào Options và chọn Confidence Interval Percentage là 95% (thường thì đây là giá trị mặc định), rồi tiếp tục nhấn Continue để quay về hộp thoại chính rồi nhấn OK để chạy test. Kết quả cho ra tôi thu được 2 bảng như sau:

So sánh số mắc trong spss năm 2024

Ở bảng thứ nhất là các số liệu thống kê tổng hợp. Tôi không quan tâm nhiều lắm. Tôi quan tâm ở bảng thứ hai vì nó sẽ cho tôi biết là có sự khác biệt giữa Nam và Nữ về mức độ thường xuyên trong việc tham gia hoạt động Câu lạc bộ tiếng Anh ở trường hay không.

Nhìn vào cột bên trái, tôi quan tâm đến dòng Equal variances assumed và đối chiếu qua cột Sig đầu tiên (tức nằm trong cột Test for Equality of Variance), tôi thấy giá trị này là .907. Giá trị này lớn hơn .05, do vậy tôi sẽ quan tâm đến giá trị Sig. ở dòng đầu tiên của cột t-test for equality of means. Giá trị này là .000, là một số nhỏ hơn .05. Do vậy tôi kết luận rằng có sự khác nhau giữa Nam và Nữ về mức độ thường xuyên tham gia hoạt động CLB của trường.

Trường hợp nếu giá trị .907 này là một số nhỏ hơn hoặc bằng .05 thì tôi sẽ tiếp tục quan sát giá trị Sig ở dòng Equal variances not assumed (dòng thứ 2) và xét giá trị ở cột Sig (2-tailed) thuộc cột t-test for Equality of Means.

Bài tiếp theo tôi sẽ nói về test dùng để so sánh biến dạng scale như thế này nhưng áp dụng với 3 nhóm đối tượng trở lên.

Khai báo biến (hay còn gọi là mã hóa) và nhập liệu là những bước đầu tiên để có bộ dữ liệu mà SPSS có thể hiểu và thực hiện được các phân tích thống kê. Bài viết sẽ hướng dẫn chi tiết ý nghĩa các thuộc tính của biến và thao tác khai báo biến, nhập liệu trong SPSS.

1. Khai báo biến

Sau khi khởi động SPSS, nhấp chuột vào cửa sổ Variable View để chuyển sang màn hình khai báo biến. Mỗi biến được tạo ra trên 1 dòng, các cột trên dòng thể hiện các thuộc tính của biến (Hình 1).

So sánh số mắc trong spss năm 2024

Hình 1. Cửa số Variable View để khai báo biến

Các thuộc tính của biến bao gồm:

- Name (tên biến): độ dài không quá 8 ký tự hay ký số, không có ký tự đặc biệt và không bắt đầu bằng ký số, gõ trực tiếp tên biến vào ô trong cột Name.

- Type (kiểu biến): mặc định chương trình sẽ chọn kiểu định lượng (Numberic). Các kiểu biến bao gồm:

  • Numeric: các giá trị được nhập vào và hiển thị ở dạng chữ số.
  • Comma: các giá trị số có dấu phẩy (,) được chèn vào giữa những nhóm ba chữ số để phân biệt hàng nghìn, hàng triệu… Chúng ta chỉ nhập dữ liệu mà không cần chèn (,) SPSS tự động hiển thị giá trị có ngăn cách bằng (,). Ví dụ 1000000 = 1,000,000
  • Dot: tương tự kiểu Comma, nhưng sử dụng dấu chấm (.) để ngăn cách giữa những nhóm ba chữ số và dấu phẩy được dùng cho chữ số hàng thập phân. Ví dụ 1000000,9999 = 1.000.000,9999
  • Scientific Notation: kiểu biến dùng ký tự E để hiển thị chữ số mũ. Cơ số được viết bên trái chữ E, số mũ được viết bên phải chữ E. Ví dụ số 2021 được viết 2.021E3, số 0.0005 được viết 5E-4.
  • Date: kiểu biến thời gian bao gồm năm, tháng, ngày, giờ, phút, giây. Dữ liệu hiển thị tùy thuộc vào định dạng có sẵn trong SPSS mà ta chọn.
  • Dollar: giá trị của số liệu được hiển thị với một dấu dollar ($) phía trước, dấu chấm ngăn cách hàng thập phân và dấu phẩy ngăn cách nhóm ba chữ số để phân biệt hàng nghìn, hàng triệu... Chúng ta chỉ nhập dữ liệu mà không cần chèn ký tự dollar ($), SPSS sẽ tự động hiển thị ký tự này.
  • Custom Currency: Năm định dạng tùy chỉnh cho tiền tệ được đặt tên CCA, CCB, CCC, CCD và CCE. Chúng ta có thể xem và tuỳ chỉnh định dạng này bằng cách vào Edit➪Options sau đó chọn thẻ Currency.
  • String: định dạng kiểu ký tự, không dùng để tính toán. Kiểu định dạng này không giới hạn số ký tự nhập vào, thường được sử dụng cho biến mô tả.
  • Restricted Numeric (integer with leading zeros): giống kiểu biến Numeric tuy nhiên số chữ số được hiển thị trên SPSS là bằng nhau, những số liệu nhập vào mà ít hơn số ký tự được hiển thị thì SPSS mặc định thêm vào chữ số 0 phía trước đến khi đủ số ký tự như khai báo (số ký tự được khai báo trong thuộc tính Width).

Muốn thay đổi kiểu biến, độ rộng của biến (Width) hoặc số chữ số thập phân (Decimal Places), ta nhấn chuột vào nút … trong ô Type.

So sánh số mắc trong spss năm 2024

Hình 2. Khai báo thuộc tính Type của biến

- Width (độ rộng của biến): số ký số hay ký tự tối đa có thể nhập vào.

- Decimals: số lẻ sau dấu phẩy.

- Label (nhãn của biến): câu mô tả để giải thích ý nghĩa của biến, cần ngắn gọn.

- Values: là thuộc tính quan trọng nhất để mã hóa thang đo định tính, các thông tin thu thập từ thang đo định lượng đã ở dưới dạng số và có ý nghĩa nên không cần mã hóa.

Ví dụ: Xin vui lòng cho biết giới tính của anh/chị?

1. Nữ 2. Nam

Để thực hiện mã hóa cho câu hỏi trên, ta thực hiện các bước sau:

  • Bước 1: Nhấn chuột vào nút …của ô trên cột Values, hộp thoại khai báo Value Labels sẽ xuất hiện
  • Bước 2: Nhập các giá trị Value (mã hóa các thang đo định tính) và Label (nhãn giải thích ý nghĩa của mã số đã nhập)
  • Bước 3: Nhấn nút Add
  • Bước 4: Tiếp tục khai báo cho các giá trị mã hóa còn lại trong câu hỏi, sau đó bấm OK

So sánh số mắc trong spss năm 2024

Hình 3. Khai báo thuộc tính Values của biến

- Missing: khai báo các loại giá trị khuyết. Ví dụ, với câu hỏi giới tính, vì lý do nào đó người được điều tra từ chối trả lời, trong hộp Value labels, ta quy ước giá trị 99 có nhãn là “không trả lời”, sau đó ở cột Missing ta phải khai báo 99 là giá trị khuyết, khi thực hiện tính toán, phần mềm sẽ loại giá trị khuyết để có kết quả hợp lí. Cách đặt con số đại diện cho Missing value cần căn cứ vào ngữ cảnh và sự lựa chọn của người xử lý (ví dụ, nếu chọn 99 làm Missing value cho biến độ tuổi có thể gây nhầm lẫn khi cuộc điều tra có người trả lời đạt 99 tuổi, trong trường hợp này ta có thể chọn con số khác như 999 hay -100…)

So sánh số mắc trong spss năm 2024

Hình 4. Khai báo thuộc tính Missing của biến

- Columns: khai báo độ rộng của biến khi nhập liệu, thường chọn 8.

- Align: vị trí dữ liệu được nhập trong cột, thường chọn Right.

- Measure: loại thang đo thể hiện dữ liệu gồm Norminal (thang đo danh nghĩa), Ordinary (thang đo thứ bậc), Scale (gồm thang đo khoảng cách và thang đo tỉ lệ) (Để phân biệt các loại thang đo, xem thêm bài viết Phân biệt các loại thang đo trong nghiên cứu).

So sánh số mắc trong spss năm 2024

Hình 5. Khai báo loại thang đo của biến

Sau khi tạo xong một biến, xuống dòng để tạo các biến khác theo những bước như trên. Đối với câu hỏi có một lựa chọn, chỉ cần tạo một biến để nhập liệu câu trả lời. Trong trường hợp câu hỏi có nhiều lựa chọn, cần tạo nhiều biến, số lượng biến cần tạo bằng số lựa chọn của người trả lời có nhiều lượt chọn nhất. Ví dụ, có 3 người trả lời cho một câu hỏi, người thứ nhất có 2 lựa chọn, người thứ hai có 3 lựa chọn, người thứ ba có 5 lựa chọn thì số biến cần tạo cho câu hỏi trên là 5 biến.

2. Nhập liệu

Ví dụ: Có 5 người trả lời 3 câu hỏi bên dưới:

Câu 1. Xin vui lòng cho biết giới tính của Anh/Chị?

1. Nữ 2. Nam

Câu 2. Xin vui lòng cho biết thu nhập hàng tháng của Anh/ Chị ? …………………..triệu đồng

Câu 3. Xin vui lòng cho biết các loại báo mà Anh/Chị thường hay đọc?

  1. Sài Gòn Giải Phóng
  2. Thanh Niên
  3. Tuổi Trẻ
  4. Tiền Phong
  5. VNExpress
  6. Cafebiz
  7. Khác

Kết quả trả lời như sau:

So sánh số mắc trong spss năm 2024

Tiến hành khai báo biến cho các câu hỏi theo những bước trong phần khai báo biến

So sánh số mắc trong spss năm 2024

Hình 6. Khai báo biến cho các câu hỏi ví dụ

Sau khi thực hiện khai báo các biến ở cửa số Variable View, ta chuyển qua cửa sổ Data View, tiến hành nhập số liệu vào SPSS cho từng biến.

So sánh số mắc trong spss năm 2024

Hình 7. Khai báo biến cho các câu hỏi ví dụ

Sau khi khai báo biến và nhập liệu, ta có file dữ liệu SPSS để tiếp tục thực hiện các phân tích cần thiết khác (như thống kê tần suất, đánh giá độ tin cậy của thang đo, phân tích nhân tố, phân tích hồi quy…)