Viết Excel với Python Pandas. Bạn có thể ghi bất kỳ dữ liệu nào [danh sách, chuỗi, số, v.v.] vào Excel, trước tiên bằng cách chuyển đổi dữ liệu đó thành Khung dữ liệu Pandas và sau đó ghi Khung dữ liệu vào Excel
Để xuất Khung dữ liệu Pandas dưới dạng tệp Excel [phần mở rộng. . xlsx,. xls], sử dụng phương pháp
$ pip install xlwt4
$ pip install openpyxl
khóa học liên quan. Phân tích dữ liệu với Python Pandas
cài đặtxlwt, openpyxl
$ pip install xlwt4 sử dụng thư viện có tên là xlwt và openpyxl trong nội bộ
$ pip install openpyxl
- xlwt được sử dụng để viết. xls [định dạng lên đến Excel2003]
- openpyxl được sử dụng để viết. xlsx [định dạng Excel2007 trở lên]
Cả hai có thể được cài đặt với pip. [pip3 tùy thuộc vào môi trường]
1
2
$ pip install xlwt
$ pip install openpyxl
Viết Excel
Ghi DataFrame vào tệp Excel
Cần nhập openpyxl nếu bạn muốn nối nó vào tệp Excel hiện có được mô tả ở cuối.
Một khung dữ liệu được xác định bên dưới.
1
2
3
4
5
6
7
8
9
10
11
import pandas as pd
import openpyxl
df = pd.DataFrame[[[11, 21, 31], [12, 22, 32], [31, 32, 33]],
index=['one', 'two', 'three'], columns=['a', 'b', 'c']]
print[df]
# a b c
# one 11 21 31
# two 12 22 32
# three 31 32 33
Bạn có thể chỉ định một đường dẫn làm đối số đầu tiên của
$ pip install xlwt6
$ pip install openpyxl
Ghi chú. rằng dữ liệu trong tệp gốc sẽ bị xóa khi ghi đè lên
Đối số
$ pip install xlwt7 là tên của sheet. Nếu bỏ qua sẽ có tên là
$ pip install openpyxl
$ pip install xlwt8
$ pip install openpyxl
1
$ pip install xlwt0
$ pip install openpyxl
khóa học liên quan. Phân tích dữ liệu với Python Pandas
Nếu không cần ghi chỉ số [tên hàng], cột [tên cột] thì đối số chỉ số, cột là Sai
1
$ pip install xlwt2
$ pip install openpyxl
Viết nhiều DataFrames vào tệp Excel
Đối tượng ExcelWriter cho phép bạn sử dụng nhiều gấu trúc. Các đối tượng DataFrame có thể được xuất sang các trang riêng biệt
Như một ví dụ, gấu trúc. Chuẩn bị một đối tượng DataFrame khác
$ pip install xlwt3____14
$ pip install openpyxl
Sau đó sử dụng hàm ExcelWriter[] như thế này
$ pip install xlwt0
$ pip install openpyxl
$ pip install xlwt1
$ pip install openpyxl
Bạn không cần phải gọi cho nhà văn. lưu [], nhà văn. close[] trong các khối
Nối vào một tệp Excel hiện có
Bạn có thể nối thêm DataFrame vào tệp Excel hiện có. Đoạn mã dưới đây mở một tệp hiện có, sau đó thêm hai trang tính với dữ liệu của các khung dữ liệu
Excel là một ứng dụng bảng tính được phát triển bởi Microsoft. Nó là một công cụ dễ truy cập để sắp xếp, phân tích và lưu trữ dữ liệu trong các bảng. Nó được sử dụng rộng rãi trong nhiều ứng dụng khác nhau trên toàn thế giới. Từ Nhà phân tích đến Giám đốc điều hành, nhiều chuyên gia khác nhau sử dụng Excel cho cả thống kê nhanh và xử lý dữ liệu nghiêm túc
tài liệu excel
Tài liệu bảng tính Excel được gọi là sổ làm việc được lưu trong tệp có tên. phần mở rộng xlsx. Hàng đầu tiên của bảng tính chủ yếu dành cho tiêu đề, trong khi cột đầu tiên xác định đơn vị lấy mẫu. Mỗi workbook có thể chứa nhiều sheet còn được gọi là worksheet. Một hộp tại một cột và hàng cụ thể được gọi là một ô và mỗi ô có thể bao gồm một số hoặc giá trị văn bản. Lưới các ô có dữ liệu tạo thành một trang tính
Trang tính hiện hoạt được định nghĩa là trang tính mà người dùng hiện đang xem hoặc xem lần cuối trước khi đóng Excel
Đọc từ tệp Excel
Trước tiên, bạn cần viết lệnh để cài đặt mô-đun xlrd
Tạo sổ làm việc
Một sổ làm việc chứa tất cả dữ liệu trong tệp excel. Bạn có thể tạo một bảng tính mới từ đầu hoặc bạn có thể dễ dàng tạo một bảng tính từ tệp excel đã tồn tại
Tệp đầu vào
Chúng tôi đã chụp ảnh nhanh của sổ làm việc
Mã số
Giải trình. Trong ví dụ trên, đầu tiên, chúng tôi đã nhập mô-đun xlrd và xác định vị trí của tệp. Khi đó ta đã mở workbook từ file excel đã có
Đọc từ Pandas
Pandas được định nghĩa là một thư viện mã nguồn mở được xây dựng trên đầu thư viện NumPy. Nó cung cấp phân tích nhanh, làm sạch dữ liệu và chuẩn bị dữ liệu cho người dùng và hỗ trợ cả tiện ích mở rộng xls và xlsx từ URL
Đó là gói python cung cấp cấu trúc dữ liệu có lợi được gọi là khung dữ liệu
Ví dụ
Đọc từ openpyxl
Trước tiên, chúng ta cần cài đặt mô-đun openpyxl bằng cách sử dụng pip từ dòng lệnh
Sau đó, chúng ta cần nhập mô-đun
Chúng tôi cũng có thể đọc dữ liệu từ bảng tính hiện có bằng openpyxl. Nó cũng cho phép người dùng thực hiện các phép tính và thêm nội dung không phải là một phần của tập dữ liệu gốc
Ví dụ
đầu ra
Để tìm hiểu thêm về openpyxl, hãy truy cập hướng dẫn đầy đủ của chúng tôi Bấm vào đây. Chúng tôi đã thảo luận chi tiết cần thiết trong hướng dẫn này