Dấu phân cách đường đọc Python
Sau khi sử dụng câu lệnh Python with để mở tệp dữ liệu, chúng ta có thể lặp qua nội dung của tệp bằng vòng lặp for. Khi dữ liệu được đọc, phương thức split() được sử dụng để tách văn bản thành các từ Show
Trong trường hợp của chúng tôi, văn bản được phân tách bằng khoảng trắng, đây là hành vi mặc định của phương thức split() ví dụ 1. Tách dữ liệu nhân viên bằng Python
đầu ra
Tách chuỗi bằng dấu phẩyChúng tôi cung cấp một dấu tách tùy chọn cho phương thức split() để chỉ định ký tự nào sẽ tách chuỗi với. Dấu phân cách mặc định là khoảng trắng Trong ví dụ tiếp theo, chúng tôi sẽ sử dụng dấu phẩy để tách dữ liệu điểm kiểm tra được đọc từ một tệp điểm. txt ví dụ 2. Tách điểm bằng dấu phẩy
Phương thức strip() được sử dụng ở đây để xóa ký tự xuống dòng (\n) khỏi cuối dòng đầu ra
Tách tệp văn bản bằng splitlines()Phương thức splitlines() được sử dụng để lấy danh sách các dòng trong tệp văn bản. Đối với các ví dụ tiếp theo, chúng tôi sẽ giả vờ rằng chúng tôi điều hành một trang web dành riêng cho một công ty rạp hát. Chúng tôi đang đọc dữ liệu tập lệnh từ các tệp văn bản và đẩy nó lên trang web của công ty juliet. txt Chúng ta có thể đọc tệp và chia các dòng thành một danh sách bằng phương thức splitlines(). Sau đó, một vòng lặp for có thể được sử dụng để in nội dung của dữ liệu văn bản ví dụ 3. Sử dụng splitlines() để đọc tệp văn bản
Sử dụng Trình tạo để phân tách tệp văn bảnTrong Python, trình tạo là một thủ tục đặc biệt có thể được sử dụng để tạo một mảng. Trình tạo tương tự như một hàm trả về một mảng, nhưng nó trả về một phần tử tại một thời điểm Người tạo sử dụng từ khóa năng suất. Khi Python gặp một câu lệnh năng suất, nó sẽ lưu trữ trạng thái của hàm cho đến sau này, khi trình tạo được gọi lại. romeo. txt Ví dụ 4. Tách tệp văn bản bằng trình tạo
Đọc dữ liệu tệp với khả năng hiểu danh sáchKhả năng hiểu danh sách Python cung cấp một giải pháp tinh tế để làm việc với danh sách. Chúng ta có thể tận dụng cú pháp ngắn hơn để viết mã của mình với khả năng hiểu danh sách. Ngoài ra, các câu lệnh hiểu danh sách thường dễ đọc hơn Trong các ví dụ trước của chúng tôi, chúng tôi đã phải sử dụng vòng lặp for để đọc các tệp văn bản. Chúng ta có thể trao đổi vòng lặp for của mình để lấy một dòng mã bằng cách sử dụng khả năng hiểu danh sách Cú pháp hiểu danh sách. Khi dữ liệu đã được lấy thông qua khả năng hiểu danh sách, chúng tôi sử dụng phương thức split() để tách các dòng và thêm chúng vào danh sách mới. Ví dụ 5. Sử dụng hiểu danh sách để đọc dữ liệu tệp Chia một tệp văn bản thành nhiều tệp nhỏ hơnĐiều gì sẽ xảy ra nếu chúng tôi có một tệp lớn mà chúng tôi muốn chia thành các tệp nhỏ hơn? Với việc cắt danh sách, chúng tôi nói với Python rằng chúng tôi muốn làm việc với một phạm vi phần tử cụ thể từ một danh sách nhất định. Điều này được thực hiện bằng cách cung cấp điểm bắt đầu và điểm kết thúc cho lát cắt Trong Python, một danh sách có thể được cắt bằng dấu hai chấm. Trong ví dụ sau, chúng tôi sẽ sử dụng cắt danh sách để chia tệp văn bản thành nhiều tệp nhỏ hơn Tách một tệp bằng List SlicingMột danh sách có thể được phân chia bằng cách sử dụng danh sách cắt lát Python. Để làm như vậy, trước tiên chúng tôi đọc tệp bằng phương thức readlines(). Tiếp theo, nửa trên của tệp được ghi vào một tệp mới có tên romeo_A. txt. Chúng tôi sẽ sử dụng cắt danh sách trong vòng lặp for này để ghi nửa đầu của tệp gốc vào một tệp mới Sử dụng vòng lặp for một giây, chúng ta sẽ viết phần còn lại của văn bản vào một tệp khác. Để thực hiện slice ta cần phương thức len() để tìm tổng số dòng trong file gốc. Ví dụ 6. Tách một tệp văn bản thành nhiều tệp văn bản
Chạy chương trình này trong cùng thư mục với romeo. txt sẽ tạo các tệp văn bản sau romeo_A. txt bài viết liên quanChúng ta đã thấy cách sử dụng phương thức split() để chia nhỏ tệp văn bản. Ngoài ra, các ví dụ của chúng tôi đã chỉ ra cách split() được sử dụng song song với trình tạo Python và khả năng hiểu danh sách để đọc các tệp lớn một cách thanh lịch hơn Tận dụng nhiều phương thức tích hợp sẵn của Python, chẳng hạn như split() và readlines(), cho phép chúng tôi xử lý các tệp văn bản nhanh hơn. Sử dụng những công cụ này sẽ giúp chúng ta tiết kiệm thời gian và công sức Nếu bạn nghiêm túc về việc thành thạo Python, bạn nên đầu tư thời gian để học cách sử dụng các phương pháp này để chuẩn bị các giải pháp của riêng mình Nếu bạn muốn tìm hiểu thêm về lập trình với Python, vui lòng truy cập các hướng dẫn sau từ Python cho người mới bắt đầu
Có liên quanĐào tạo Python được đề xuấtMón ăn. Python 3 cho người mới bắt đầu Hơn 15 giờ nội dung video với hướng dẫn có hướng dẫn cho người mới bắt đầu. Tìm hiểu cách tạo các ứng dụng trong thế giới thực và nắm vững kiến thức cơ bản Readlines() trả về kiểu dữ liệu gì?Phương thức readlines() trả về danh sách chứa từng dòng trong tệp dưới dạng mục danh sách .
readline() Strip() là gì?readline() đọc một dòng từ tệp. Kết quả bao gồm một dấu '\n'. . strip() xóa tất cả khoảng trắng ở đầu và cuối (e. g. '\n' ) đã đề cập ở trên từ một chuỗi .
Phương thức read() khác với readline() trong Python như thế nào?Hàm read() sẽ đọc toàn bộ tệp cùng một lúc và sau đó in ra các ký tự đầu tiên chiếm bao nhiêu byte mà bạn chỉ định trong dấu ngoặc đơn so với hàm readline() sẽ chỉ đọc và in ra các ký tự đầu tiên chiếm bao nhiêu byte.
readline() có lấy \n ở cuối dòng không?Phương thức readline đọc một dòng từ tệp và trả về dưới dạng một chuỗi. Chuỗi do readline trả về sẽ chứa ký tự xuống dòng ở cuối . |