Thêm Python vào Excel

Trang web này chứa các gợi ý đến thông tin tốt nhất hiện có về cách làm việc với các tệp Excel bằng ngôn ngữ lập trình Python

Đọc và ghi tệp Excel

Có sẵn các gói python để hoạt động với các tệp Excel sẽ chạy trên bất kỳ nền tảng Python nào và không yêu cầu sử dụng Windows hoặc Excel. Chúng nhanh, đáng tin cậy và mã nguồn mở

openpyxl

Gói khuyến nghị để đọc và ghi tệp Excel 2010 (ví dụ:. . xlsx)

Tải xuống. Tài liệu. Cai Xô nhỏ

xlsxwriter

Một gói thay thế để ghi dữ liệu, định dạng thông tin và đặc biệt là biểu đồ ở định dạng Excel 2010 (tức là. . xlsx)

Tải xuống. Tài liệu. GitHub

pyxlsb

Gói này cho phép bạn đọc các tệp Excel ở định dạng xlsb

Tải xuống. GitHub

pylightxl

Gói này cho phép bạn đọc các tệp xlsxxlsm và ghi các tệp xlsx

Tải xuống. Tài liệu. GitHub

xlrd

Gói này dùng để đọc dữ liệu và định dạng thông tin từ các tệp Excel cũ hơn (tức là. . xls)

Tải xuống. Tài liệu. GitHub

xlwt

Gói này dùng để ghi dữ liệu và định dạng thông tin vào các tệp Excel cũ hơn (tức là. . xls)

Tải xuống. Tài liệu. ví dụ. GitHub

xlutils

Gói này tập hợp các tiện ích yêu cầu cả

from openpyxl import Workbook
workbook = Workbook()
spreadsheet = workbook.active
spreadsheet["A1"] = "Hello"
spreadsheet["B1"] = "World!"
workbook.save(filename="HelloWorld.xlsx")
1 và
from openpyxl import Workbook
workbook = Workbook()
spreadsheet = workbook.active
spreadsheet["A1"] = "Hello"
spreadsheet["B1"] = "World!"
workbook.save(filename="HelloWorld.xlsx")
2, bao gồm khả năng sao chép và sửa đổi hoặc lọc các tệp excel hiện có

NB. Nói chung, các trường hợp sử dụng này hiện được bao phủ bởi openpyxl

Tải xuống. Tài liệu. GitHub

Viết Add-In Excel

Các sản phẩm sau có thể được sử dụng để viết phần bổ trợ Excel bằng Python. Không giống như các gói trình đọc và trình ghi, chúng yêu cầu cài đặt Microsoft Excel

PyXLL

PyXLL là một sản phẩm thương mại cho phép viết phần bổ trợ Excel bằng Python mà không cần VBA. Các hàm Python có thể được hiển thị dưới dạng các hàm trang tính (UDF), macro, menu và thanh công cụ ribbon

Trang chủ. Đặc trưng. Tài liệu. Tải xuống

xlwings

xlwings là một thư viện mã nguồn mở để tự động hóa Excel bằng Python thay vì VBA và hoạt động trên Windows và macOS. bạn có thể gọi Python từ Excel và ngược lại và viết UDF bằng Python (chỉ dành cho Windows). xlwings PRO là một tiện ích bổ sung thương mại với chức năng bổ sung

Trang chủ. Tài liệu. GitHub. Tải xuống

Danh sách gửi thư / Nhóm thảo luận

Có một Group của Google chuyên làm việc với file Excel bằng Python, bao gồm các thư viện liệt kê bên trên cùng thao tác với ứng dụng Excel qua COM

Phát triển thương mại

Các công ty sau đây có thể cung cấp tư vấn và phát triển phần mềm thương mại và là chuyên gia làm việc với các tệp Excel bằng Python

Microsoft Excel là nền tảng của phân tích dữ liệu trước khi công nghệ đưa ra các công cụ toàn diện hơn giúp nhiệm vụ phân tích dữ liệu dễ dàng hơn rất nhiều. Microsoft Excel chứa một số lượng lớn các chức năng và cùng với tính dễ sử dụng, nó đã trở thành một công cụ không thể thiếu cho mọi hình thức giáo dục, kinh doanh, tài chính và nghiên cứu, kể cả một số lĩnh vực. Microsoft Excel tiếp tục là một công cụ phân tích dữ liệu phổ biến để tổ chức và trình bày một lượng lớn dữ liệu. Tuy nhiên, với sự gia nhập của Python và các ngôn ngữ lập trình tương tự, việc phân tích dữ liệu đã trở thành một trò chơi bóng hoàn toàn khác.  

Trước khi đi sâu vào cách Python đã thay đổi bối cảnh phát triển web, quản lý cơ sở hạ tầng và phân tích dữ liệu, đây là cái nhìn về những thách thức mà Microsoft Excel đang cố gắng vượt qua

  • Lỗi cú pháp. Người dùng Excel thường gặp lỗi khi nhập công thức thủ công hoặc khi sao chép và dán dữ liệu trong một số phạm vi ô.  
  • Vân đê bảo mật. Các công ty cần cảnh giác với thông tin mà họ đặt trong trang tính Excel, điều này khiến dữ liệu này dễ bị lạm dụng và tấn công mạng
  • Tăng khối lượng dữ liệu. Một vài năm trước, dữ liệu được lưu trữ trong Excel và các hoạt động có thể được thực hiện trơn tru trên dữ liệu này. Nhưng với sự gia tăng lớn về khối lượng dữ liệu, việc tiếp tục lưu trữ dữ liệu này trong bảng tính Excel trở nên không khả thi vì nó dẫn đến các vấn đề phân tích phức tạp. Điều này xảy ra vì Microsoft Excel chủ yếu hướng tới các tập dữ liệu nhỏ hơn.  

Giới thiệu về Python

Thêm Python vào Excel
Nguồn hình ảnh

Ban đầu Python được phát triển như một ngôn ngữ lập trình đa năng để tự động hóa các tác vụ tẻ nhạt mà các nhà phát triển có thể phải đối mặt hàng ngày. Nhưng giờ đây nó đã phát triển để dẫn đầu sự phát triển của một cộng đồng khoa học dữ liệu rộng lớn hơn, nhờ tiềm năng và khả năng tuyệt đối của nó. Python có thể được sử dụng cho nhiều loại ứng dụng như đã thảo luận trước đây, từ phát triển ứng dụng đến thực hiện Phân tích dữ liệu khám phá trên dữ liệu khách hàng để trích xuất thông tin chi tiết hữu ích từ dữ liệu đó. Việc chuyển đổi từ Microsoft Excel sang Python diễn ra do các trường hợp sử dụng sau

  • Khai thác dữ liệu. Bạn có thể nói, trích xuất dữ liệu từ Twitter và thực hiện phân tích tình cảm trên các tweet để xác định tỷ lệ phần trăm mọi người có thể hài lòng/không hài lòng với điều gì đó. Bạn có thể làm điều tương tự trên trang web Thương mại điện tử như Amazon để tìm hiểu phản hồi cho một sản phẩm cụ thể và thu thập thông tin đầu vào sâu sắc có thể giúp bạn cải thiện trải nghiệm của khách hàng
  • Tòa nhà chuỗi khối. Bạn có thể xây dựng một Chuỗi khối bằng Python có thể được sử dụng cho bất kỳ loại giao dịch tài chính nào
  • Tự động hóa dữ liệu. Bạn có thể tự động hóa nhiều tác vụ đơn giản như định dạng dữ liệu, đổi tên tệp, kiểm tra chính tả, tạo báo cáo Microsoft Excel bằng Python để bắt đầu
  • Xây dựng ứng dụng. Bạn có thể xây dựng các ứng dụng tương tác giúp bạn đạt được một nhiệm vụ cụ thể bằng Python bằng cách tận dụng các thư viện Python tích hợp sẵn để cung cấp cho bạn vô số khả năng.   

Đơn giản hóa Phân tích dữ liệu của bạn với Đường ống dữ liệu không mã của Hevo

Nền tảng Đường ống dữ liệu không mã được quản lý hoàn toàn như Hevo giúp bạn tích hợp dữ liệu từ Microsoft Excel và Python với hơn 100 nguồn dữ liệu khác đến đích bạn chọn trong thời gian thực một cách dễ dàng. Hevo với đường cong học tập tối thiểu có thể được thiết lập chỉ trong vài phút cho phép người dùng tải dữ liệu mà không phải ảnh hưởng đến hiệu suất. Sự tích hợp mạnh mẽ của nó với vô số nguồn cung cấp cho người dùng sự linh hoạt để đưa vào các loại dữ liệu khác nhau, một cách trơn tru mà không cần phải viết mã một dòng nào.  

Kiểm tra một số tính năng thú vị của Hevo

  • hoàn toàn tự động. Nền tảng Hevo có thể được thiết lập chỉ trong vài phút và yêu cầu bảo trì tối thiểu
  • Truyền dữ liệu theo thời gian thực. Hevo cung cấp khả năng di chuyển dữ liệu theo thời gian thực, vì vậy bạn luôn có thể có dữ liệu sẵn sàng cho phân tích
  • Truyền dữ liệu hoàn chỉnh và chính xác 100%. Cơ sở hạ tầng mạnh mẽ của Hevo đảm bảo truyền dữ liệu đáng tin cậy mà không làm mất dữ liệu
  • Cơ sở hạ tầng có thể mở rộng. Hevo có tích hợp sẵn cho hơn 100 nguồn như Excel và Python, có thể giúp bạn mở rộng quy mô cơ sở hạ tầng dữ liệu theo yêu cầu
  • Hỗ trợ trực tiếp 24/7. Nhóm Hevo luôn sẵn sàng hỗ trợ đặc biệt cho bạn thông qua trò chuyện, email và các cuộc gọi hỗ trợ
  • Quản lý lược đồ. Hevo loại bỏ nhiệm vụ quản lý lược đồ tẻ nhạt & tự động phát hiện lược đồ của dữ liệu đến và ánh xạ nó tới lược đồ đích
  • Giám sát trực tiếp. Hevo cho phép bạn giám sát luồng dữ liệu để bạn có thể kiểm tra xem dữ liệu của mình đang ở đâu tại một thời điểm cụ thể

Bạn có thể dùng thử miễn phí Hevo bằng cách đăng ký dùng thử miễn phí 14 ngày

Hiểu thiết lập tích hợp Excel Python

Để thiết lập Tích hợp Excel Python, bạn có thể sử dụng một vài thư viện Python tiện dụng và bắt đầu quá trình này. Thư viện Python là một tập hợp các phương thức và chức năng cho phép bạn thực hiện các hành động mà không phải viết mã cho nó từ đầu. Điều này mang lại hiệu quả cho công việc của Nhà phân tích dữ liệu vì họ có thể chỉ cần nhập các thư viện cần thiết. Chẳng hạn, Google Tensorflow là một thư viện Python được sử dụng để phát triển các dự án máy học. SciKit Learn là một thư viện Python hữu ích khi xử lý các bộ dữ liệu phức tạp.   

Hai thư viện bạn có thể sử dụng cho Excel Python Integration là openpyxl và pandas. Các phần tiếp theo thảo luận chi tiết về cách bạn có thể sử dụng chúng.  

Phương pháp 1. Sử dụng thư viện openpyxl để tích hợp Excel Python

Thêm Python vào Excel
Nguồn hình ảnh

openpyxl có thể được sử dụng cho Excel Python Integration để trích xuất dữ liệu từ cơ sở dữ liệu thành bảng tính Excel hoặc chuyển đổi bảng tính Excel sang định dạng có lập trình. Đây là một vài trường hợp sử dụng mà bạn có thể cần sử dụng openpyxl để tích hợp Excel Python

  • Xuất sang Bảng tính. Đưa ra một bảng cơ sở dữ liệu nơi bạn lưu trữ tất cả thông tin khách hàng. Thông tin này sẽ được yêu cầu bởi nhóm Tiếp thị để quảng bá sản phẩm mới của công ty nói trên. Trong trường hợp không có quyền truy cập vào cơ sở dữ liệu hoặc không có kiến ​​thức SQL tối thiểu để trích xuất thông tin, openpyxl có thể được sử dụng để chuyển đổi bảng cơ sở dữ liệu này thành bảng tính Excel.  
  • Thêm thông tin bổ sung vào bảng tính. Bây giờ đối với ví dụ trên, giả sử bạn cần thêm tổng số tiền mà khách hàng đã chi tiêu trong cửa hàng của bạn vào bảng tính Excel của bạn. Để thực hiện việc này, bạn sẽ phải lặp qua toàn bộ bảng tính, lặp qua từng hàng và trích xuất tổng số tiền trên cơ sở dữ liệu. Giá trị này sau đó sẽ được thêm vào bảng tính Excel.  

Dưới đây là các bước để sử dụng openpyxl cho Tích hợp Excel Python

  • Bước 1. Trước tiên, bạn cần cài đặt gói openpyxl bằng pip. Viết lệnh sau trong thiết bị đầu cuối của bạn
$ pip install openpyxl
  • Bước 2. Khi bạn đã hoàn tất cài đặt openpyxl, bạn có thể thiết lập bảng tính Excel mẫu bằng đoạn mã sau
from openpyxl import Workbook
workbook = Workbook()
spreadsheet = workbook.active
spreadsheet["A1"] = "Hello"
spreadsheet["B1"] = "World!"
workbook.save(filename="HelloWorld.xlsx")
  • Bước 3. Bước tiếp theo sẽ là xem liệu bạn có thể đọc bảng tính mẫu mà bạn đã tạo trước đây cho Tích hợp Python trong Excel hay không. Bạn có thể sử dụng đoạn mã sau để mở nó
>>>from openpyxl import load_workbook
>>> workbook = load_workbook(filename="sample.xlsx")

>>> workbook.sheetnames
['Sheet 1']

>>> spreadsheet = workbook.active
>>> spreadsheet


>>> spreadsheet.title
  • Bước 4. Lấy dữ liệu từ bảng tính Excel bằng đoạn mã sau
>>> spreadsheet["A1"]


>>> spreadsheet["A1"].value
'marketplace'

>>> spreadsheet["F10"].value
"G-Shock Men's Grey Sport Watch"
  • Bước 5. Giờ đây, bạn có thể lặp lại dữ liệu và bắt đầu chuyển đổi dữ liệu thành định dạng có thể được sử dụng để phân tích dữ liệu, đây là một trong những mục tiêu chính của Tích hợp Python trong Excel. Việc lặp lại có thể được thực hiện bằng cách sử dụng kết hợp các hàng và cột để cắt
>>> spreadsheet["A1:C2"]
((, , ), 
 (, , ))

Điều này cho biết tất cả dữ liệu bảng tính từ A1 đến C2

  • Bước 6. Trường hợp sử dụng tiếp theo của Tích hợp Excel Python được thảo luận là thêm dữ liệu vào bảng tính Excel hiện có. Đây là đoạn mã để thêm một số dữ liệu vào bảng tính mẫu được tạo ở bước thứ hai
from openpyxl import load_workbook
# Begin by opening the spreadsheet and selecting the main sheet 
workbook = load_workbook(filename="hello_world.xlsx")
spreadsheet = workbook.active
# Enter what you want into a specific cell
spreadsheet["C1"]="Manipulating_Data ;)"
# Save the spreadsheet
workbook.save(filename)="hello_world_append.xlsx"

Khi mở tài liệu, bạn sẽ nhận thấy rằng Manipulation_Data đã được thêm vào bảng tính Excel của bạn.    

Phương pháp 2. Sử dụng thư viện gấu trúc để tích hợp Excel Python

Thêm Python vào Excel
Nguồn hình ảnh

Bạn cũng có thể sử dụng thư viện gấu trúc để tích hợp Excel Python. Pandas là thư viện Python được sử dụng rộng rãi nhất để tương tác với các tệp Excel. Bạn có thể sử dụng thư viện này để tải dữ liệu từ bảng tính Excel của mình và thực hiện các thao tác chính như chèn, xóa cột và hàng cũng như nối thêm thông tin nếu cần. Phương pháp tích hợp Excel Python này chủ yếu được sử dụng cho Phân tích dữ liệu khám phá trong đó bạn lấy dữ liệu có trong bảng tính Excel, sắp xếp và dọn dẹp dữ liệu đó, từ đó làm cho dữ liệu này sẵn sàng để phân tích

Tại đây, bạn sẽ thấy cách nhập dữ liệu từ bảng tính Excel bằng gấu trúc

  • Bước 1. Cài đặt gấu trúc bằng cách sử dụng pip trong thiết bị đầu cuối của bạn như sau
$ pip install pandas
  • Bước 2. Giả sử bạn có một sheet Microsoft Excel như sau.  
Thêm Python vào Excel
Nguồn hình ảnh

Bạn có thể xuất dữ liệu từ tệp Excel này sang pandas Dataframe bằng đoạn mã sau

Thêm Python vào Excel
Nguồn hình ảnh

Bạn có thể chọn các cột tương tự như phương pháp 1, bằng cách sử dụng cắt. Bạn có thể nối thêm một bộ dữ liệu mới vào Khung dữ liệu gấu trúc bằng cách sử dụng khung dữ liệu. chức năng nối thêm (). Ở đây khung dữ liệu sẽ được thay thế bằng tên khung dữ liệu của bạn. Để biết thêm thông tin về điều tương tự, hãy tham khảo tài liệu về gấu trúc.    

Phần kết luận

Bài viết này nói về hai phương pháp đơn giản mà bạn có thể sử dụng để thiết lập Tích hợp Excel Python cho hoạt động kinh doanh của mình. Ban đầu nó nói về Microsoft Excel và Python trước khi đi sâu vào Excel Python Integration

Trích xuất dữ liệu phức tạp từ một tập hợp nguồn dữ liệu đa dạng có thể là một nhiệm vụ đầy thách thức và đây là lúc Hevo tiết kiệm thời gian. Hevo cung cấp một cách nhanh hơn để di chuyển dữ liệu từ Cơ sở dữ liệu hoặc ứng dụng SaaS vào Kho dữ liệu của bạn để được hiển thị trong công cụ BI. Hevo hoàn toàn tự động và do đó không yêu cầu bạn viết mã. Bạn có thể dùng thử miễn phí Hevo bằng cách đăng ký dùng thử miễn phí 14 ngày. Bạn cũng có thể xem giá cạnh tranh nhất sẽ giúp bạn chọn gói phù hợp cho nhu cầu kinh doanh của mình

Bạn có thể thêm Python vào Excel không?

Có nhiều gói Python khác nhau để làm việc với Excel. Phần lớn trong số này là để đọc và ghi các tệp Excel (e. g. openpyxl và xlsxwriter). PyXLL rất khác với các gói khác này. Thay vì chỉ cho phép bạn đọc và ghi tệp Excel, PyXLL tích hợp Python vào Excel .

Làm cách nào để cài đặt Python trên Excel?

Làm cách nào để kết nối Python với Excel?

Các bước để nhập tệp Excel vào Python bằng Pandas .
Bước 1. Chụp đường dẫn tập tin. Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn. .
Bước 2. Áp dụng mã Python. .
Bước 3. Chạy mã Python để nhập tệp Excel

Bạn có thể sử dụng Python trong Excel thay vì VBA không?

Phải, chắc chắn rồi. VBA thường được sử dụng để tự động hóa Excel bằng macro, thêm các hàm trang tính mới do người dùng xác định (UDF) và phản ứng với các sự kiện Excel. Mọi thứ trước đây bạn đã làm trong Excel bằng VBA đều có thể đạt được bằng Python. Sử dụng Python để thay thế VBA có nhiều lợi ích và thường nhanh hơn VBA