Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Trong một số tình huống, biến có quá nhiều giá trị sẽ gây những trở ngại nhất định cho các phép thống kê. Vì vậy, các biến này cần được mã hóa lại để còn ít nhóm giá trị hơn. Xét ví dụ sau: Lập bảng tần số đối với dữ liệu về tuổi của những nhân viên tham gia trả lời trong nghiên cứu về sự hài lòng trong công việc, ta có bảng tần số dưới đây:

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Nhằm mục đích sử dụng biến tuổi cho một số kiểm định, phân tích, nhà nghiên cứu quyết định chia biến này thành các nhóm như sau: (1) Dưới 25 tuổi, (2) Từ 25 đến 35 tuổi, (3) Trên 35 tuổi. Tiến hành mã hóa lại biến trên SPSS 26, chúng ta vào Transform > Recode into Different Variables…

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Đưa biến cần mã hóa từ khung bên trái vào hộp Input Variable -> Output Variable.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Nhập tên biến mới (biến chứa các nhóm giá trị đã mã hóa) vào ô Name, nhập nhãn cho biến mới vào ô Label. Sau đó nhấp vào nút Change. Tiếp tục nhấp vào nút Old and New Values.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Cửa sổ Old and New Values xuất hiện cho phép chúng ta chuyển đổi giá trị cũ sang giá trị mới.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

SPSS có nhiều tùy chọn để chúng ta chia nhóm cho các giá trị hiện tại. Tuy nhiên, ba mục trong vùng bôi đỏ ở hình trên được sử dụng nhiều nhất:

  1. Range … through … : Đoạn giá trị từ bao nhiêu tới bao nhiêu (đoạn giá trị bao gồm cả giá trị đầu và cuối).
  2. Range, LOWEST through value: Đoạn giá trị từ giá trị thấp nhất cho đến mức giá trị nhập vào.
  3. Range, value through HIGHEST: Đoạn giá trị từ giá trị nhập vào cho đến mức giá trị cao nhất.

Như đã xác định ban đầu, chúng ta sẽ chia các mức tuổi thành ba nhóm:

Mức 1: Dưới 25 tuổi

Chúng ta sử dụng lựa chọn Range, LOWEST through value với giá trị nhập vào là 24. Ô New Value, chúng ta gán giá trị mới là 1. Sau đó nhấp vào nút Add.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Mức 2: Từ 25 đến 35 tuổi

Chúng ta sử dụng lựa chọn Range … through … với giá trị Range là 25 và giá trị through là 35. Ô New Value, chúng ta gán giá trị mới là 2. Sau đó nhấp vào nút Add.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Mức 3: Trên 35 tuổi

Chúng ta sử dụng lựa chọn Range, HIGHTEST through value với giá trị nhập vào là 36. Ô New Value, chúng ta gán giá trị mới là 3. Sau đó nhấp vào nút Add.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Sau khi đã phân nhóm giá trị xong, nhấp vào nút Continue. Cửa sổ quay về giao diện ban đầu, nhấp tiếp nút OK để kết thúc quá trình mã hóa. Tại giao diện Data View, chúng ta sẽ thấy biến mới tên DoTuoi đã được tạo ra và có sẵn dữ liệu.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Chúng ta chuyển sang giao diện Variable View để khai báo giá trị vào Values của biến mới với 1: Dưới 25 tuổi, 2: Từ 25 đến 35 tuổi và 3: Trên 35 tuổi.

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Như vậy, chúng ta đã hoàn thành việc mã hóa lại biến Tuoi có rất nhiều giá trị sang biến DoTuoi chỉ còn ba giá trị.

Đối với những người mới biết đến SPSS hoặc thậm chí những người không thông thạo SPSS, đều sẽ cảm thấy bối rối trong lần đầu tiên xử lý số liệu trong phần mềm này. Mã hóa dữ liệu trong SPSS là bước đầu tiên giúp bạn thu hoạch được kết quả trong quãng thời gian nghiên cứu. Vậy hãy để Tri Thức Cộng Đồng giới thiệu đến bạn mã hóa dữ liệu là gì, cách mã hóa dữ liệu trong SPSS như thế nào?

Mục lục

1. Mã hóa dữ liệu trong SPSS là gì?

Mã hóa dữ liệu trong SPSS là bước chuyển các dữ liệu trong bài khảo sát từ dạng chữ hoặc số sang dạng dữ liệu bằng số được gắn theo một trật tự nhất định.

Mục đích: Giúp phần mềm định dạng, dễ dàng sắp xếp và phân tích được các dữ liệu nhập vào bằng cách mã hóa chúng.

2. Tổng hợp 3 cách mã hóa dữ liệu trong spss

Có rất nhiều cách để mã hóa dữ liệu trong SPSS, nhưng trong bài viết dưới đây, Tri Thức Cộng Đồng sẽ giới thiệu với bạn 3 cách mã hóa dữ liệu phổ biến nhất trong SPSS như sau:

  • Mã hóa dữ liệu thành các biến khác nhau
  • Mã hóa dữ liệu thành các biến giống nhau
  • Cú pháp DO IF

Mỗi phương pháp đều có cách làm khác nhau, trong đó:

  • Mã hóa dữ liệu thành các biến khác nhau, cú pháp DO IF: Mã hóa dữ liệu thành một biến khác, không đè lên dữ liệu ban đầu
  • Mã hóa dữ liệu thành các biến giống nhau: Ghi đè các giá trị mới vĩnh viễn lên các biến ban đầu.

Lời khuyên: Tốt nhất là bạn nên sử dụng cách mã hóa dữ liệu trong SPSS thành một biến khác để không bị thay đổi dữ liệu gốc và có thể dễ dàng truy cập dữ liệu gốc nếu sau này bạn cần sửa đổi.

2.1. Mã hóa dữ liệu thành các biến khác nhau

Giới thiệu: Đây là cách mã hóa dữ liệu bằng việc ghi lại toàn bộ chúng thành một biến khác. Nghĩa là, các thay đổi không ghi đè lên biến ban đầu, thay vào đó là một bản sao của các biến ban đầu dưới một tên mới.

Cách làm:

Bước 1: Tại thanh công cụ của phần mềm SPSS, nhấn vào Transform (Chuyển đổi), sau đó nhấn tiếp Recode into Different Variables (Mã hóa dữ liệu thành các biến khác nhau)

Bước 2: Cửa sổ Mã hóa sẽ xuất hiện với các trường như sau:

A - Biến đầu vào -> Biến đầu ra: Danh sách các biến bạn sẽ chọn để mã hóa

B - Biến đầu ra: Xác định tên và nhãn dán cho các biến bạn muốn mã hóa, sau khi hoàn tất nhấn Change.

C - Giá trị cũ và mới: Nhấp vào biểu tượng này để chỉ định cách bạn muốn mã hóa lại các giá trị cho biến đã chọn.

D- Tùy chọn IF: Lệnh tùy chọn cho phép bạn chỉ định các điều kiện mà theo đó các nhãn dán về mã hóa của bạn được áp dụng (chủ yếu áp dụng trong cách 3)

Cột bên trái liệt kê các biến trong tập dữ liệu của bạn. Chọn biến bạn muốn mã hóa lại bằng cách nhấp vào biến đó và bấm mũi tên ở giữa để di chuyển vào cột A.

Bước 3: Sau khi chuyển các biến cần mã hóa sang cột A, tiếp theo hãy nhập tên và các chỉ định mới cho biến bạn cần mã hóa theo lần lượt định dạng B, C, D. Lần lượt như sau:

B - Biến đầu ra: Điền tên vào Name và nhãn dán vào Label của biến muốn mã hóa

C - Giá trị cũ và mới: Nhấn vào biểu tượng này, cửa sổ mới xuất hiện như sau:

1 - Giá trị cũ

  • Value: Nhập mã số cụ thể của biến hiện có
  • System-missing: Áp dụng cho mọi giá trị thiếu hệ thống
  • System-or-user-missing: Áp dụng cho mọi giá trị thiếu hệ thống hoặc mã giá trị bị thiếu đặc biệt do người dùng xác định trong cửa sổ Viewer.
  • Range: Phạm vi của các dữ liệu cũ được đo bằng các phép đo liên tục. Có thể đặt 2 giá trị thấp nhất và giá trị cao nhất của phạm vi biến trong 2 ô bên dưới.
  • All other values: Áp dụng cho tất cả các giá trị

2 - Giá trị mới: Chỉ định các giá trị mới cho biến cũ của bạn

3 - Chuyển cũ -> mới: Chọn các biến đã được chọn lọc và chỉ định trong các vùng 1, 2, sau đó ấn vào Add của vùng 3.

Lưu ý bạn sẽ cần lặp lại các bước này cho từng giá trị bạn muốn mã hóa. Sau khi hoàn tất có thể nhấn nút Continue.

4 - Biến đầu ra là chuỗi: Tùy chọn cho phép thay đổi định dạng của kiểu biến mới - kiểu biến chuỗi.

D - Tùy chọn IF

Nếu như bạn chỉ muốn mã hóa các giá trị cho một biến cụ thể phù hợp với điều kiện đưa ra của bạn, bạn hãy sử dụng tính năng này.

1: Cột hiển thị các biến trong tập dữ liệu của bạn.

2: Đặc điểm của các biến.

  • Bao gồm tất cả các trường hợp
  • Chỉ bao gồm các biến nếu thỏa mãn trường hợp

3: Trung tâm của cửa sổ bao gồm các tập hợp toán tử số học, các toán tử Boolean và các ký tự số giúp bạn thiết lập các điều kiện cho biến.

4: Hộp chứa các hàm phổ biến để tính giá trị cho các biến mới (Ví dụ: Trung bình, logarit…).

Sau khi hoàn tất viết xác định các điều kiện mới cho biến cần mã hóa, nhấn Continue.

Bước 4:

Khi bạn đã hoàn thành mọi bước và sẵn sàng để chạy quy trình, chọn OK. Bây giờ biến mới của bạn sẽ được mã hóa theo các tiêu chí đã chỉ định. Bạn có thể thấy giá trị các biến mới trong cột cuối cùng của chế độ Data viewer hoặc hàng cuối cuối của Variable viewer.

2.2. Mã hóa dữ liệu thành các biến giống nhau

Các bước làm cũng tương tự như dạng mã hóa dữ liệu thành các biến khác nhau, ngoại trừ việc lưu ra thành bản sao cho các biến mới thì cách làm này sẽ ghi đề giá trị lên các biến ban đầu.

Các bước thực hiện:

Bước 1: Trên thanh công cụ chọn Transform -> Recode into Same Variables.

Bước 2: Cửa số mã hóa dữ liệu giống nhau sẽ xuất hiện

Bước 3: Các trường hiển thị tương tự như cách làm trên, các bạn có thể kéo lên trên để tham khảo lại.

Bước 4: Sau khi hoàn tất các bước, nhấn OK để quá trình mã hóa bắt đầu diễn ra.

Lưu ý: Cách tốt nhất là không nên mã hóa lại các dữ liệu trong SPSS vào cùng biến vì nó sẽ đè lên biến ban đầu. Nếu bạn cần sử dụng biến ở dạng ban đầu (hoặc muốn kiểm tra lại các bước của mình) thì rất khó để lấy lại thông tin, vì chúng đã bị biến mất.

2.3. Mã hóa dữ liệu bằng Cú pháp DO IF

Cú pháp DO IF - ELSE có các bước thực hiện tương tự như thủ tục mã hóa đã được trình bày ở trên, nhưng khác ở điểm cú pháp này cho phép kiểm soát nhiều hơn việc chỉ định phạm vi số liệu với những điều kiện ràng buộc nhất định.

Câu lệnh của cú pháp DO IF - ELSE IF:

DO IF (conditional statement)

COMPUTE (variable assignment statement).

ELSE IF (conditional statement).

COMPUTE (variable assignment statement).

...

ELSE.

COMPUTE (variable assignment statement).

END IF.

EXECUTE.

Các dòng lệnh DO IF và lệnh ELSE IF cho SPSS có thể thực hiện các phép tính lồng nhau nếu điều kiện nhất định được đưa ra là đúng.

Các lệnh COMPUTE là câu lệnh mà nơi các biến mới thực sự được tính toán hoặc thiết lập để đưa ra giá trị gán thích hợp.

Nếu những cách làm trên còn khiến bạn cảm thấy băn khoăn vì các bước làm phức tạp, bạn lo lắng không đủ kiến thức và kỹ năng để xử lý dữ liệu một cách hoàn hảo. Hãy lựa chọn giải pháp thuê xử lý số liệu SPSS của trung tâm Tri Thức Cộng Đồng để hoàn thiện bài nghiên cứu một cách tốt nhất.

3 . Ví dụ mã hóa dữ liệu SPSS

Để giúp các bạn hình dung rõ hơn về cách làm cũng như từng bước chi tiết về mã hóa dữ liệu trong SPSS, Trung tâm đã đưa ra các ví dụ cụ thể cho từng cách làm như dưới đây.

3.1. Ví dụ Hợp nhất 2 dữ liệu thành 1 biến mới

Đề bài: Trong tập dữ liệu mẫu, biến CommuteTime đại diện cho lượng thời gian (tính bằng phút) mà người trả lời cần để đi đến trường. Yêu cầu mã hóa các biến này thành 3 nhóm sau:

  • 1 = Lộ trình đi ít hơn 30 phút (CommuteTime ≤ 30)
  • 2 = Thời gian đi kéo dài hơn 30 phút nhưng ít hơn 60 phút (30 < CommuteTime < 60)
  • 3 = Lộ trình đi hơn 60 phút (CommuteTime ≥ 60)

Cách thực hiện:

Bước 1: Chọn Transform -> Recode into different variables

Bước 2: Chọn biến CommuteTime trong hộp Biến đầu vào -> Biến đầu ra. Trong vùng Output Variable, nhập tên của biến mới, ví dụ CommuteLength, rồi nhấn nút Change.

Bước 3: Mở mục Old and new Values, lần lượt điền các thông tin sau:

  • Xử lý các giá trị bị thiếu trước tiên: Trong vùng Old Value (1), nhấn chọn System-missing, trong vùng New Value (2), nhấp vào System-missing. Sau đó nhấp vào Add.
  • Xác định nhóm 1 (CommuteTime ≤ 30): Trong vùng Old Value (1), nhấp vào Range, LOWEST through value và nhập 30; trong vùng New Value (2), nhấp vào Value và nhập 1. Sau đó nhấp vào Add.
  • Xác định nhóm 3 (CommuteTime ≥ 60): Trong vùng Old Value (1), nhấp vào Range, value through HIGHEST và nhập 60; trong vùng New Value (2), nhấp vào Value và nhập 3. Sau đó nhấp vào Add.
  • Xác định nhóm 2 (30 < CommuteTime < 60): Trong vùng Old Value (1), bấm All other values; trong vùng New Value (2), nhấp vào Value và nhập 2. Sau đó nhấp vào Add.
  • Khi hoàn tất, bấm Continue.

Bước 4: Bấm OK.

3.2. Ví dụ mã hóa dữ liệu thành biến giống nhau

Đề bài: Tương tự như cách Mã hóa dữ liệu thành biến khác nhau ở trên.

Cách thực hiện:

Bước 1: Chọn Transform -> Recode into different variables

Bước 2: Chọn biến CommuteTime trong hộp Biến đầu vào -> Biến đầu ra. Trong vùng Output Variable, nhập tên của biến mới, ví dụ CommuteLength, rồi nhấn nút Change.

Bước 3: Mở mục Old and new Values, lần lượt điền các thông tin như ở trên.

Bước 4: Bấm OK.

3.3. Ví dụ mã hóa bằng cú pháp DO IF

Đề bài: Giả sử chúng ta có điểm kiểm tra dưới tỷ lệ phần trăm, và muốn chuyển đổi các giá trị này thành điểm bằng chữ, theo quy luật như sau:

  • ́Dưới 60: F
  • 60 - 69: D
  • 70 - 79: C
  • 80 - 89: B
  • Trên 90: A

Cách mã hóa số liệu: Đối với đề bài như thế này, chúng ta sẽ sử dụng câu lệnh DO IF để tiến hành mã hóa. Ví dụ mẫu của câu lệnh như sau, giả sử điểm số được gắn dưới biến là MathGrade:

Bước 1: Tạo một tệp cú pháp mới bằng cách: File -> New -> Syntax

Bước 2: Nhập cú pháp sau:

DO IF(MISSING(Math)).

COMPUTE MathGrade=$SYSMIS.

ELSE IF (Math < 60).

COMPUTE MathGrade = F.

ELSE IF (Math >= 60 AND Math < 70).

COMPUTE MathGrade = D.

ELSE IF (Math >= 70 AND Math < 80).

COMPUTE MathGrade = C.

ELSE IF (Math >= 80 AND Math < 90).

COMPUTE MathGrade = B.

ELSE IF (Math >= 90).

COMPUTE MathGrade = A.

END IF.

EXECUTE.

Bước 3: Đánh dấu cú pháp và sau đó nhấn nút Run Selection.

Bạn đọc có nhu cầu tìm hiểu kỹ hơn về cách mã hóa dữ liệu trong SPSS, bạn có thể tham khảo hướng dẫn cách nhập SPSS chi tiết được Tri Thức Cộng Đồng tỉ mỉ biên soạn và gửi đến quý Anh/ chị.

Như vậy với những hướng dẫn chi tiết về cách mã hóa dữ liệu trong SPSS cùng với các ví dụ minh họa rõ ràng, hy vọng bạn đọc đã nắm rõ được phương pháp và có thể áp dụng trong bài làm của mình. Nếu có bất kỳ thắc mắc nào, hãy liên lạc ngay với Tri Thức Cộng Đồng để được giải đáp nhé! Chúc các bạn có một kết quả thành công.

Tài liệu tham khảo

1. LibGuides: SPSS Tutorials: Recoding Variables. (2020). Kentstate University. https://libguides.library.kent.edu/spss/recodevariables

Cách dùng transform trong spss mã hóa biến giớu tính năm 2024

Content Manager tại Tri thức Cộng đồng

Xin chào, tôi là Hà Phương. Hiện tại Quản lý nội dung (Content Manager) của Tri Thức Cộng Đồng. Từ bé tôi đã yêu thích đọc sách và sáng tác nội dung, tôi đã nuôi dưỡng ước mơ và phấn đấu trong 5 năm để trở thành Quản lý nội dung tại Tri Thức Cộng Đồng. Với tôi mọi sự thành công đều cần ước mơ và nỗ lực. Bạn hãy tham khảo website https://trithuccongdong.net để tìm hiểu rõ hơn về công việc của tôi nhé.