Pandas DataFrame sang ví dụ về bảng HTML
Ngôn ngữ đánh dấu siêu văn bản (HTML) là ngôn ngữ đánh dấu tiêu chuẩn để xây dựng các trang web. Chúng tôi có thể kết xuất dữ liệu dạng bảng bằng HTML ________ 08 và ________ 09 để chúng tôi có thể nhập và xuất dữ liệu sang DataFrames Show Trong bài viết này, chúng ta sẽ tìm hiểu cách đọc dữ liệu dạng bảng từ tệp HTML và tải nó vào Khung dữ liệu Pandas. Chúng ta cũng sẽ tìm hiểu cách ghi dữ liệu từ Pandas DataFrame và vào tệp HTML Ghi chú. Trong bài viết này, chúng ta sẽ đọc và viết HTML yếu tố. Bài viết này không bao gồm phân tích cú pháp toàn bộ tệp HTMLĐọc HTMLChúng ta có thể đọc các bảng của tệp HTML bằng hàm 0. Hàm này đọc các bảng tệp HTML dưới dạng Pandas DataFrames. Nó có thể đọc từ một tệp hoặc một URLChúng ta hãy xem xét từng nguồn đầu vào một Đọc dữ liệu HTML từ một tệpĐối với phần này, chúng tôi sẽ sử dụng một bộ dữ liệu đầu vào. Một bảng chứa các ngôn ngữ lập trình và năm tạo ra chúng. Bảng khác có kích thước đất và chi phí của chúng bằng USD Lưu nội dung HTML sau vào tệp có tên 1 Ngôn ngữ lập trình Người sáng tạoNăm CDennis Ritchie1972PythonGuido Van Rossum1989Ruby Yukihiro Matsumoto 1995 2 3 để phân tích các tệp HTML và XML. Để chức năng 0 hoạt động, bạn cần cài đặt 5 6 đã được cài đặt, chúng ta có thể sử dụng chức năng 0. Nó trả về một danh sách các DataFrames, trong đó mỗi DataFrame là toàn bộ thành phần bảng của tệp HTML đã cho. Chúng tôi truy cập từng bảng dưới dạng DataFrame bằng cách lập chỉ mục danh sáchĐoạn mã dưới đây minh họa việc sử dụng hàm 0 để đọc các bảng từ tệp HTMLGhi chú. Mặc dù bạn cần cài đặt 5, nhưng bạn không cần nhập nó vào chương trình của mình để Pandas hoạt độngChạy đoạn mã trên trên trình thông dịch Python sẽ tạo ra đầu ra sau
Đọc dữ liệu HTML từ URLCũng giống như chúng ta đọc các phần tử bảng từ tệp HTML, chúng ta cũng có thể đọc các phần tử bảng từ trang web HTML vào DataFrame với 0. Tuy nhiên, thay cho tên tệp, chúng tôi sẽ cung cấp một URL như thế này 5Và nó sẽ trả về một danh sách các Khung dữ liệu trong đó mỗi Khung dữ liệu đại diện cho một thành phần bảng từ URL đã cho Dưới đây là mã ví dụ để đọc các thành phần bảng từ URL của trang web bằng Pandas Nếu chúng tôi chạy thành công đoạn mã trên, chúng tôi có thể thấy đầu ra là 6Chúng tôi biết rằng chúng tôi có thể đọc các thành phần bảng từ một trang web. Tuy nhiên, khi trang web yêu cầu xác thực, mã chạy vào ngoại lệ sau 7Để đọc dữ liệu từ các URL như vậy, chúng tôi sẽ sử dụng mô-đun 51. Bạn có thể cài đặt nó với 52 0Bây giờ, chúng tôi sẽ sử dụng phương pháp 53 từ thư viện 51 để đưa ra yêu cầu tới URL của trang web trong khi cung cấp tham số 55 tùy chọn nếu trang web yêu cầu xác thựcPhương thức này trả về một đối tượng phản hồi từ trang web. Chúng tôi có thể kiểm tra mã trạng thái (để đảm bảo nội dung chắc chắn ở đó) và lấy văn bản từ đối tượng phản hồi, sau đó chuyển đổi bảng thành DataFrame Hãy xem một ví dụ về việc sử dụng 51 để lấy dữ liệu yêu cầu xác thực. Với mục đích này, chúng tôi đang sử dụng https. //httpbin. tổ chức 5Khi thực thi đoạn mã trên, chúng ta có thể thấy đầu ra sau Hãy xem hướng dẫn thực hành, thực tế của chúng tôi để học Git, với các phương pháp hay nhất, tiêu chuẩn được ngành chấp nhận và bao gồm bảng gian lận. Dừng các lệnh Git trên Google và thực sự tìm hiểu nó 6Điều này cho thấy rằng chúng tôi đã truy cập thành công nội dung trang web của một URL được xác thực. Tuy nhiên, trang web này chỉ chứa dữ liệu JSON và chúng tôi cần các phần tử bảng HTML dưới dạng DataFrames Hãy sử dụng URL trước đó và sử dụng 51 để đọc các bảng HTML dưới dạng DataFrames. Mặc dù trang web trước đó là công khai nhưng các bước để truy cập nội dung được xác thực vẫn giống nhauKhi chúng tôi nhận được phản hồi, chúng tôi có thể chuyển phương thức 58 sang 0. Và như thường lệ, chúng ta sẽ nhận được danh sách các bảng mà nó chứa dưới dạng DataFramesChạy mã này sẽ tạo ra đầu ra sau 6Viết bảng HTML với Pandas của PythonChúng tôi đã đọc thành công dữ liệu từ các bảng HTML. Hãy viết Pandas DataFrame trong tệp HTML. Điều này có thể đạt được bằng cách sử dụng phương pháp 9 9 lấy đường dẫn của tệp bạn muốn xuất dữ liệu sang. Nếu bạn không cung cấp một đường dẫn tuyệt đối, nó sẽ lưu một tệp liên quan đến thư mục hiện tạiBạn có thể xuất DataFrame sang bảng HTML như thế này 0Mã này sẽ tạo ra tệp sau 62 trong thư mục hiện tại 1Lưu ý rằng quá trình xuất không phải là toàn bộ tài liệu HTML mà chỉ là bản thân bảng HTML Viết các bảng HTML theo kiểu với Pandas của PythonNhư chúng ta có thể thấy, theo mặc định, đường viền của bảng là 1, căn lề phải và nó cũng có các chỉ số DataFrame trong các thẻ. Chúng tôi có thể thay đổi cấu trúc mặc định này bằng cách cung cấp một vài tham số tùy chọn Ẩn chỉ mụcNếu chúng tôi không muốn bao gồm chỉ mục trong đầu ra của bảng, chúng tôi có thể đặt 63 trong 9 2Mã này tạo tệp 62 với nội dung sau 3Thay đổi viền bảngĐường viền bảng mặc định là 1 pixel. Để thay đổi mặc định này, chúng ta có thể đặt tham số 66 thành giá trị tính bằng pixelĐoạn mã sau thay đổi đường viền thành 3 pixel 4Tệp được tạo hiện đặt thuộc tính đường viền của bảng thành "3" 1Điều chỉnh văn bảnTheo mặc định, văn bản đầu của bảng được căn phải. Chúng tôi thay đổi sự liên kết này với tham số 67. Ví dụ: thực hiện 68 sẽ thêm 69 vào thẻ của thẻHãy thử căn chỉnh văn bản đầu vào giữa và xem kết quả 6Bảng được tạo bởi đoạn mã trên trông như thế này 7Văn bản của đầu bảng hiện được căn chỉnh đẹp mắt ở giữa Phần kết luậnTrong hướng dẫn này, chúng ta đã học cách nhập và xuất dữ liệu bảng HTML bằng Pandas DataFrames. Chúng tôi đã tải dữ liệu bảng HTML từ các tệp cũng như từ các URL của trang web. Trong trường hợp URL được xác thực, chúng tôi đã sử dụng mô-đun yêu cầu để xác thực và truy xuất dữ liệu của trang web, sau đó chuyển văn bản phản hồi vào hàm 0Chúng tôi cũng đã viết Pandas DataFrame dưới dạng tệp HTML bằng hàm 9. Sau đó, chúng tôi đã tạo kiểu cho bảng đã tạo bằng cách chuyển một vài tham số tùy chọn như 72, 66 và 67. Điều này giúp dễ dàng ghi dữ liệu của DataFrame theo cách trình bày
Làm cách nào để chuyển đổi DataFrame của gấu trúc sang bảng HTML?Pandas trong Python có khả năng chuyển đổi Pandas DataFrame thành bảng trong trang web HTML. gấu trúc. Khung dữ liệu. Phương thức to_html() được sử dụng để hiển thị Khung dữ liệu Pandas.
Làm cách nào để hiển thị DataFrame của gấu trúc trong HTML?Mã HTML với jinja
. Một vài ví dụ. Với tính năng lọc - https. //github. com/frmdstryr/smd-search. Trình xem đơn giản - https. //github. com/codelv/enaml-web/tree/master/examples/dataframe_viewer
Làm cách nào để chuyển đổi DataFrame thành tệp HTML trong Python?Chuyển khung dữ liệu sang HTML . # chuyển đổi thành khung dữ liệu df = pd. DataFrame(data=students) # in khung dữ liệu print(df) # chuyen sang html html = df. to_html() # in html in(html) # chuyen sang html html = df. to_html() tệp = open("chỉ mục. html", "w"). ghi (html) tập tin. đóng lại() Làm cách nào để tạo bảng HTML trong Python?thay thế = thay thế. split("\n") print(replace) conto = conto. định dạng(*thay thế) html = html. replace("<---conti--->", conto) with open(myfile := "table.html", "w") as file:. tập tin. viết (html) hệ điều hành. tệp bắt đầu (tệp của tôi) |