Cách trích xuất dữ liệu từ tệp csv trong python bằng gấu trúc

Tôi có một tệp csv chứa đầy dữ liệu của 10 năm và tôi muốn trích xuất hai giá trị cụ thể từ năm 2018 có trong tệp lớn đó

    df = pd.read_csv[fn, parse_dates=[0]]
    df = df.set_index['date']

Điều này đã được thực hiện để trích xuất ngày giao dịch cuối cùng của mỗi tháng trong năm 2018. [chỉ có ngày xuất hiện dưới dạng đầu ra, không có dữ liệu nào khác]

    start_date = '2018-01-01'
    end_date = '2018-12-31'
    months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
    print[months_of_2018]

Tôi muốn trích xuất dữ liệu của các giá trị tháng sáu và tháng chín thuộc về s_001. Làm thế nào tôi có thể đạt được điều đó?

Để truy cập dữ liệu từ tệp CSV, chúng tôi yêu cầu hàm read_csv[] truy xuất dữ liệu ở dạng Dataframe

Cú pháp của read_csv[]

cú pháp. pd. read_csv[filepath_or_buffer, sep=’ ,’ , header=’infer’,  index_col=Không, usecols=Không, engine=Không, bỏ qua=Không, nrows=Không]

Thông số.  

  • filepath_or_buffer. Đó là vị trí của tệp sẽ được truy xuất bằng chức năng này. Nó chấp nhận mọi đường dẫn chuỗi hoặc URL của tệp
  • tháng chín. Nó là viết tắt của dấu phân cách, mặc định là ',' như trong CSV [các giá trị được phân tách bằng dấu phẩy]
  • tiêu đề. Nó chấp nhận int, một danh sách int, số hàng để sử dụng làm tên cột và bắt đầu dữ liệu. Nếu không có tên nào được thông qua, tôi. e. , header=None, thì nó sẽ hiển thị cột đầu tiên là 0, cột thứ hai là 1, v.v.
  • sử dụng. Nó được sử dụng để chỉ truy xuất các cột đã chọn từ tệp CSV
  • cau mày. Nó có nghĩa là một số hàng sẽ được hiển thị từ tập dữ liệu
  • chỉ mục_col. Nếu Không, không có số chỉ mục nào được hiển thị cùng với bản ghi.  
  • mũi dùi. Bỏ qua các hàng đã chuyển trong khung dữ liệu mới

Đọc CSV bằng Pandas read_csv

Trước khi sử dụng chức năng này, chúng tôi phải nhập thư viện Pandas, chúng tôi sẽ tải tệp CSV

PYTHON3




# Import pandas

import pandas as pd

 

# reading csv file

pd.read_csv["example1.csv"]

đầu ra

 

ví dụ 1. Sử dụng sep trong read_csv[]

Trong ví dụ này, chúng tôi sẽ thao tác với tệp CSV hiện có của mình và sau đó thêm một số ký tự đặc biệt để xem cách hoạt động của tham số sep

Python3




# headbrain1 = "totalbill_tip, sex:smoker, day_time, size

    start_date = '2018-01-01'
    end_date = '2018-12-31'
    months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
    print[months_of_2018]
0

    start_date = '2018-01-01'
    end_date = '2018-12-31'
    months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
    print[months_of_2018]
1

import0

import1

import2

import3

 

import4

import pandas as pd

 

import7

import8import9 pd.read_csv[______41pandas as pd2

_______43____44____39____46pandas as pd2

pandas as pd3pandas as pd9import9# reading csv file1]

 

# reading csv file3

import8

đầu ra

 

ví dụ 2. Sử dụng usecols trong read_csv[]

Ở đây, chúng tôi chỉ xác định 3 cột, tôi. e. [“tip”, “sex”, “time”] để tải và chúng tôi sử dụng tiêu đề 0 làm tiêu đề mặc định

Python3




import8import9 pd.read_csv[# reading csv file8pandas as pd2

pd.read_csv[0pd.read_csv[1import9pd.read_csv[3pandas as pd2

pd.read_csv[0pd.read_csv[6import9pd.read_csv[8pd.read_csv[9pandas as pd2"example1.csv"1pandas as pd2"example1.csv"3"example1.csv"4

 

import8

đầu ra

 

ví dụ 3. Sử dụng index_col trong read_csv[]

Ở đây, chúng tôi sử dụng chỉ mục “sex” trước và sau đó là chỉ mục “tip”, chúng tôi chỉ cần lập chỉ mục lại tiêu đề với tham số index_col

Python3




import8import9 pd.read_csv[# reading csv file8pandas as pd2

pd.read_csv[0pd.read_csv[1import9pd.read_csv[3pandas as pd2

pd.read_csv[0]7import9pd.read_csv[8"example1.csv"1pandas as pd2pd.read_csv[9# headbrain1 = "totalbill_tip, sex:smoker, day_time, size3

pd.read_csv[0pd.read_csv[6import9pd.read_csv[8pd.read_csv[9pandas as pd2"example1.csv"1pandas as pd2"example1.csv"3"example1.csv"4

 

import8

đầu ra

 

Ví dụ 4. Sử dụng mũi tên trong read_csv[]

Ở đây, chúng tôi chỉ hiển thị 5 hàng bằng tham số nrows

Python3




import8import9 pd.read_csv[# reading csv file8pandas as pd2

pd.read_csv[0pd.read_csv[1import9pd.read_csv[3pandas as pd2

pd.read_csv[0]7import9pd.read_csv[8pd.read_csv[9pandas as pd2"example1.csv"1# headbrain1 = "totalbill_tip, sex:smoker, day_time, size3

pd.read_csv[0pd.read_csv[6import9pd.read_csv[8pd.read_csv[9pandas as pd2"example1.csv"1pandas as pd2"example1.csv"3# headbrain1 = "totalbill_tip, sex:smoker, day_time, size3

import13import14import9import16]

 

import8

đầu ra

 

Ví dụ 5. Sử dụng bỏ qua trong read_csv[]

Các phím bỏ qua giúp bỏ qua một số hàng trong CSV, tôi. e, ở đây bạn sẽ quan sát thấy rằng hàng trên và hàng cuối cùng từ dữ liệu CSV gốc đã bị bỏ qua

Làm cách nào để trích xuất dữ liệu từ CSV bằng Python Pandas?

Panda đọc CSV .
Tải CSV vào DataFrame. nhập gấu trúc dưới dạng pd. df = pd. read_csv['dữ liệu. csv'].
In DataFrame mà không cần phương thức to_string[]. nhập gấu trúc dưới dạng pd. .
Kiểm tra số lượng hàng được trả lại tối đa. nhập gấu trúc dưới dạng pd. .
Tăng số hàng tối đa để hiển thị toàn bộ DataFrame. nhập gấu trúc dưới dạng pd

Làm cách nào để đọc một cột từ tệp CSV bằng Python bằng Pandas?

Điều này có thể được thực hiện với sự trợ giúp của gấu trúc. phương thức read_csv[] . Chúng tôi sẽ chuyển tham số đầu tiên dưới dạng tệp CSV và tham số thứ hai là danh sách các cột cụ thể trong từ khóa usecols. Nó sẽ trả về dữ liệu của tệp CSV của các cột cụ thể.

Phương pháp nào được sử dụng trong Pandas để nhập tệp CSV?

Sử dụng hàm read_csv[] từ gói gấu trúc, bạn có thể nhập dữ liệu dạng bảng từ tệp CSV vào khung dữ liệu gấu trúc bằng cách chỉ định một giá trị tham số . g. pd. read_csv["tên tệp. csv"] ].

Phương pháp nào trong Python được sử dụng để xuất DataFrame từ tệp CSV?

Khi bạn sử dụng df. to_csv[] để xuất DataFrame từ Pandas sang tệp CSV, một chỉ mục cho DataFrame sẽ tự động được đưa vào.

Chủ Đề