Tôi có một tệp csv chứa đầy dữ liệu của 10 năm và tôi muốn trích xuất hai giá trị cụ thể từ năm 2018 có trong tệp lớn đó
df = pd.read_csv[fn, parse_dates=[0]]
df = df.set_index['date']
Điều này đã được thực hiện để trích xuất ngày giao dịch cuối cùng của mỗi tháng trong năm 2018. [chỉ có ngày xuất hiện dưới dạng đầu ra, không có dữ liệu nào khác]
start_date = '2018-01-01'
end_date = '2018-12-31'
months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
print[months_of_2018]
Tôi muốn trích xuất dữ liệu của các giá trị tháng sáu và tháng chín thuộc về s_001. Làm thế nào tôi có thể đạt được điều đó?
Để truy cập dữ liệu từ tệp CSV, chúng tôi yêu cầu hàm read_csv[] truy xuất dữ liệu ở dạng Dataframe
Cú pháp của read_csv[]
cú pháp. pd. read_csv[filepath_or_buffer, sep=’ ,’ , header=’infer’, index_col=Không, usecols=Không, engine=Không, bỏ qua=Không, nrows=Không]
Thông số.
- filepath_or_buffer. Đó là vị trí của tệp sẽ được truy xuất bằng chức năng này. Nó chấp nhận mọi đường dẫn chuỗi hoặc URL của tệp
- tháng chín. Nó là viết tắt của dấu phân cách, mặc định là ',' như trong CSV [các giá trị được phân tách bằng dấu phẩy]
- tiêu đề. Nó chấp nhận int, một danh sách int, số hàng để sử dụng làm tên cột và bắt đầu dữ liệu. Nếu không có tên nào được thông qua, tôi. e. , header=None, thì nó sẽ hiển thị cột đầu tiên là 0, cột thứ hai là 1, v.v.
- sử dụng. Nó được sử dụng để chỉ truy xuất các cột đã chọn từ tệp CSV
- cau mày. Nó có nghĩa là một số hàng sẽ được hiển thị từ tập dữ liệu
- chỉ mục_col. Nếu Không, không có số chỉ mục nào được hiển thị cùng với bản ghi.
- mũi dùi. Bỏ qua các hàng đã chuyển trong khung dữ liệu mới
Đọc CSV bằng Pandas read_csv
Trước khi sử dụng chức năng này, chúng tôi phải nhập thư viện Pandas, chúng tôi sẽ tải tệp CSV
PYTHON3
# Import pandas
import
pandas as pd
# reading csv file
pd.read_csv[
"example1.csv"
]
đầu ra
ví dụ 1. Sử dụng sep trong read_csv[]
Trong ví dụ này, chúng tôi sẽ thao tác với tệp CSV hiện có của mình và sau đó thêm một số ký tự đặc biệt để xem cách hoạt động của tham số sep
Python3
# headbrain1 = "totalbill_tip, sex:smoker, day_time, size
start_date = '2018-01-01'
end_date = '2018-12-31'
months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
print[months_of_2018]
0 start_date = '2018-01-01'
end_date = '2018-12-31'
months_of_2018 = pd.date_range[start_date, end_date, freq='BM']
print[months_of_2018]
1import
0
import
1
import
2
import
3
import
4
import
pandas as pd
import
7
import
8import
9 pd.read_csv[
______41pandas as pd
2
_______43____44____39____46pandas as pd
2
pandas as pd
3pandas as pd
9import
9# reading csv file
1]
# reading csv file
3
import
8
đầu ra
ví dụ 2. Sử dụng usecols trong read_csv[]
Ở đây, chúng tôi chỉ xác định 3 cột, tôi. e. [“tip”, “sex”, “time”] để tải và chúng tôi sử dụng tiêu đề 0 làm tiêu đề mặc định
Python3
import
8import
9 pd.read_csv[
# reading csv file
8pandas as pd
2
pd.read_csv[
0pd.read_csv[
1import
9pd.read_csv[
3pandas as pd
2
pd.read_csv[
0pd.read_csv[
6import
9pd.read_csv[
8pd.read_csv[
9pandas as pd
2"example1.csv"
1pandas as pd
2"example1.csv"
3"example1.csv"
4
import
8
đầu ra
ví dụ 3. Sử dụng index_col trong read_csv[]
Ở đây, chúng tôi sử dụng chỉ mục “sex” trước và sau đó là chỉ mục “tip”, chúng tôi chỉ cần lập chỉ mục lại tiêu đề với tham số index_col
Python3
import
8import
9 pd.read_csv[
# reading csv file
8pandas as pd
2
pd.read_csv[
0pd.read_csv[
1import
9pd.read_csv[
3pandas as pd
2
pd.read_csv[
0]
7import
9pd.read_csv[
8"example1.csv"
1pandas as pd
2pd.read_csv[
9# headbrain1 = "totalbill_tip, sex:smoker, day_time, size
3
pd.read_csv[
0pd.read_csv[
6import
9pd.read_csv[
8pd.read_csv[
9pandas as pd
2"example1.csv"
1pandas as pd
2"example1.csv"
3"example1.csv"
4
import
8
đầu ra
Ví dụ 4. Sử dụng mũi tên trong read_csv[]
Ở đây, chúng tôi chỉ hiển thị 5 hàng bằng tham số nrows
Python3
import
8import
9 pd.read_csv[
# reading csv file
8pandas as pd
2
pd.read_csv[
0pd.read_csv[
1import
9pd.read_csv[
3pandas as pd
2
pd.read_csv[
0]
7import
9pd.read_csv[
8pd.read_csv[
9pandas as pd
2"example1.csv"
1# headbrain1 = "totalbill_tip, sex:smoker, day_time, size
3
pd.read_csv[
0pd.read_csv[
6import
9pd.read_csv[
8pd.read_csv[
9pandas as pd
2"example1.csv"
1pandas as pd
2"example1.csv"
3# headbrain1 = "totalbill_tip, sex:smoker, day_time, size
3
import
13import
14import
9import
16]
import
8
đầu ra
Ví dụ 5. Sử dụng bỏ qua trong read_csv[]
Các phím bỏ qua giúp bỏ qua một số hàng trong CSV, tôi. e, ở đây bạn sẽ quan sát thấy rằng hàng trên và hàng cuối cùng từ dữ liệu CSV gốc đã bị bỏ qua