Làm thế nào để bạn loại bỏ các dòng trùng lặp trong python?
Xác định những bản sao (nếu có) để giữ lại. - 5. Loại bỏ các bản sao ngoại trừ lần xuất hiện đầu tiên. - 6. Loại bỏ các bản sao ngoại trừ lần xuất hiện cuối cùng. - Sai. Bỏ tất cả các bản sao Show
Bằng cách sử dụng phương pháp 5, bạn có thể xóa các hàng trùng lặp khỏi DataFrame. Sử dụng phương pháp này, bạn có thể loại bỏ các hàng trùng lặp trên nhiều cột hoặc tất cả các cột đã chọn. Trong bài viết này, chúng tôi sẽ giải thích một số cách loại bỏ các hàng trùng lặp khỏi Pandas DataFrame với các ví dụ bằng cách sử dụng các hàm như hàm 6, 7 và hàm lambda với các ví dụCó liên quan. Pandas Nhận danh sách tất cả các hàng trùng lặp 1. Ví dụ nhanh về Drop Duplicate RowsNếu bạn đang vội, dưới đây là một số ví dụ nhanh về cách loại bỏ các hàng trùng lặp trong DataFrame của gấu trúc
2. thả trùng lặp () Cú pháp và ví dụDưới đây là cú pháp của hàm 6 loại bỏ các hàng trùng lặp khỏi DataFrame của gấu trúc
Bây giờ, hãy tạo một DataFrame với một vài hàng trùng lặp trên các cột. Khung dữ liệu của chúng tôi chứa các tên cột ________ 76, ________ 77, ________ 78 và ________ 79
Sản lượng dưới sản lượng 83. Pandas thả các hàng trùng lặpBạn có thể sử dụng 6 mà không cần bất kỳ đối số nào để loại bỏ các hàng có cùng giá trị trên tất cả các cột. Nó nhận các giá trị mặc định là 81 và 82. Ví dụ dưới đây trả về bốn hàng sau khi xóa các hàng trùng lặp trong DataFrame của chúng tôi 2Sản lượng dưới sản lượng 34. Bỏ các hàng trùng lặp và giữ hàng cuối cùngNếu bạn muốn chọn tất cả các hàng trùng lặp và lần xuất hiện cuối cùng của chúng, bạn phải chuyển một đối số giữ là 83. Ví dụ, 84 6Sản lượng dưới sản lượng 75. Xóa tất cả các hàng trùng lặp khỏi Pandas DataFrameBạn có thể đặt 85 trong hàm 86 để xóa tất cả các hàng trùng lặp. cho E. x, 87 1Sản lượng dưới sản lượng 26. Xóa các hàng trùng lặp dựa trên các cột cụ thểĐể xóa các hàng trùng lặp trên cơ sở nhiều cột, hãy chỉ định tất cả các tên cột dưới dạng danh sách. Bạn có thể đặt 85 trong hàm 86 để xóa tất cả các hàng trùng lặp 0Mang lại đầu ra tương tự như trên 7. Thả các hàng trùng lặp vào vị trí 1Sản lượng dưới sản lượng 38. Xóa các hàng trùng lặp bằng DataFrame. áp dụng () và Hàm LambdaBạn có thể xóa các hàng trùng lặp bằng hàm 7 và 21 để chuyển đổi DataFrame thành chữ thường và sau đó áp dụng chuỗi thấp hơn 3Mang lại sản lượng tương tự như trên 9. Hoàn thành ví dụ để loại bỏ các hàng trùng lặp trong DataFrame 4Sự kết luậnTrong bài viết này, bạn đã học cách thả/xóa/xóa các hàng trùng lặp bằng cách sử dụng hàm 5, 7 và 21 với các ví dụ |