Nhân dịp những ngày cuối năm Kỷ Hợi mình xin cảm ơn mọi người đã đọc bài viblo của mình trong một năm vừa qua. Và mình xin kính chúc tất cả mọi người một năm mới " Vạn Sự Như Ý, An Khang Thịnh Vượng"
Tiếp tục với bài viết thôi nào =]]. Ở bài viết lần này mình sẽ chia sẻ về việc Visualization trong data như thế nào. Tuy nhiên ở bài viết này mình sẽ sử dụng plotly thay vì matplotlib hay seaborn. Thứ nhất bởi vì mình cảm thấy nó khá là thú vị. v những cái gì mà càng trực quan thì càng làm cho chúng ta thích thú hơn mà =]]. Tiếp theo là lợi ích của nó
- nhanh
- Use use
- sự kết hợp tốt với pandas
Được rồi bây giờ chúng ta cùng bắt đầu nhé. Ở đây mình sử dụng tập dataset Titanic ở đây nha mn. Mình sẽ so sánh giữa seaborn với plotly nha. Còn ở phần thực hành mình sẽ thực thi code để so sánh Plotly với Matplotlib và Seaborn
Seaborn và Âm mưusinh ra biển
Seaborn là thư viện thú vị và có nhiều mẫu biểu đồ hơn, cú pháp câu lệnh cũng dễ sử dụng. Seaborn được rất nhiều người sử dụng và yêu thích.
Phạm Thị Hồng Anh @Honganh
Theo
3. 2K 164 46
Đã xuất bản vào ngày 16 tháng 1 năm 2020 2. 21 một. m. 7 phút đọc
1. 4K
0
1
Giới thiệu Visualization data with plotly with Titanic dataset- Bài báo cáo
- Thêm vào chuỗi của tôi
Bài đăng này đã không được cập nhật trong 2 năm
Nhân dịp những ngày cuối năm Kỷ Hợi mình xin cảm ơn mọi người đã đọc bài viblo của mình trong một năm vừa qua. Và mình xin kính chúc tất cả mọi người một năm mới " Vạn Sự Như Ý, An Khang Thịnh Vượng"
Tiếp tục với bài viết thôi nào =]]. Ở bài viết lần này mình sẽ chia sẻ về việc Visualization trong data như thế nào. Tuy nhiên ở bài viết này mình sẽ sử dụng plotly thay vì matplotlib hay seaborn. Thứ nhất bởi vì mình cảm thấy nó khá là thú vị. v những cái gì mà càng trực quan thì càng làm cho chúng ta thích thú hơn mà =]]. Tiếp theo là lợi ích của nó
- nhanh
- Use use
- sự kết hợp tốt với pandas
Được rồi bây giờ chúng ta cùng bắt đầu nhé. Ở đây mình sử dụng tập dataset Titanic ở đây nha mn. Mình sẽ so sánh giữa seaborn với plotly nha. Còn ở phần thực hành mình sẽ thực thi code để so sánh Plotly với Matplotlib và Seaborn
Seaborn và Âm mưusinh ra biển
Seaborn là thư viện thú vị và có nhiều mẫu biểu đồ hơn, cú pháp câu lệnh cũng dễ sử dụng. Seaborn được rất nhiều người sử dụng và yêu thích.
Hình 1. Ví dụ biểu đồ. phân phối cho Giá vé [Bộ dữ liệu Titanic] trong Seaborn
Thư viện seaborn cũng cung cấp nhiều biểu đồ đa dạng
Hình 2. Các biểu đồ bạn có thể sử dụng với thư viện seaborn
Tuy nhiên, vẫn có một vài hạn chế đó là tất cả đồ thị, biểu đồ của seaborn đều là tĩnh [tĩnh]. Nó chỉ ra cho chúng ta thấy những gì được hiển thị trên màn hình và không thể xem chi tiết từng ô trong biểu đồ hoặc giá trị tại 1 khoảng thời gian nào đó. Hơn nữa, bạn cũng không thể di chuyển chuột hoặc nhấp chuột để hiển thị thông tin chi tiết
Plotly could could answer the mode of seaborn. Chúng ta cùng nhau tìm hiểu xem cốt truyện hữu ích như thế nào nhé
âm mưu
Plotly có khả năng thực hiện các chức năng "Interactive Visualization". "Trực quan hóa tương tác" có thể giúp tăng thêm cảm giác thu hút =]] cũng như việc bạn có thể trình bày dữ liệu một cách trực quan hơn nữa đối với người nghe. Hình 3 dưới đây cũng là phân phối cho Giá vé trong tập dữ liệu Titanic cùng xem và so sánh nhé
Hình 3. Phân phối ò Giá vé [ nguồn. ở đây]
Thật là vi diệu phải không nào =]]. Chúng ta có thể lựa chọn các tùy chọn để hiển thị biểu đồ hoặc phóng to từng tùy chọn giá trị
Thư viện PlotlyNhư đã nói ở trên Plotly là thư viện Python hỗ trợ người dùng trực tiếp hóa dữ liệu tương tác. Nó cho phép chúng ta vẽ đồ thị tương tác không những trực quan hơn mà còn thuyết phục người nghe hơn so với matplotlib hay là seaborn
Những kiểu đồ thị mà chúng ta có thể vẽ với Plotly là gì?
- Tất cả những gì chúng ta có thể thực hiện được với Matplotlib và Seaborn
- Statistics chart
- Biểu đồ khoa học
- Biểu đồ Tài chính
- Bản đồ địa chất Hình 4. ví dụ về các đồ thị, biểu đồ có thể sử dụng trong Plotly
Cài đặt và nhập Plotly
Sử dụng pip để cài đặt Plotly
pip install plotly
pip install cufflinks
Ở đây mình sẽ sử dụng Jupyter Notebook nha cả nhà. Chúng ta sẽ phải nhập thư viện này để sử dụng
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
Thực hiện cách hoạt động của Plotly, Plotly lưu đồ thị của bạn vào một tệp html và mở ở một cửa sổ mới. Sẽ xảy ra lỗi khi bạn chạy mã trong bảng điều khiển/thiết bị đầu cuối. Làm như vậy ở đây chúng ta sẽ sử dụng cốt truyện. ngoại tuyến, iplot và init_notebook để giúp chúng tôi vẽ biểu đồ ngay trên Jupyter Notebook
Luyện tập
First read data has any
df = pd.read_csv["dataset_titanic/train.csv"]
df.head[]
Hình 5. Data file train titanic dataset
Biểu đồ tròn
Mình sẽ vẽ cột Survived bằng Plotly và matplotlib nhé
âm mưu
#labels
lab = df["Survived"].value_counts[].keys[].tolist[]
#values
val = df["Survived"].value_counts[].values.tolist[]
trace = go.Pie[labels=lab,
values=val,
marker=dict[colors=['red']],
# Seting values to
hoverinfo="value"
]
data = [trace]
cách trình bày. bạn có thể vẽ tiêu đề, tiêu đề trục x và y hoặc hiển thị chú thích
#set title
layout = go.Layout[title="Survived Distribution"]
nhân vật. khi bạn muốn hiển thị trên đồ thị, nó lấy thông số dữ liệu và bố cục đã được định nghĩa
fig = go.Figure[data = data,layout = layout]
Tiếp theo là sử dụng iplot để hiển thị thôi
iplot[fig]
Hình 6. Pie chart draw by plotly
Với matplotlib
from matplotlib import pyplot as plt
title = "pie chart"
plt.pie[val, labels=lab]
plt.axis['equal']
plt.title[title]
plt.tight_layout[]
plt.show[]
Hình 7. vẽ biểu đồ hình tròn bằng matplotlib
biểu đồ
âm mưu
________số 8Hình 8. biểu đồ cốt truyện của Plotly
matplotlib
plt.hist[df["Age"], bins=40]
plt.title["distribute of age"]
Hình 9. vẽ biểu đồ bằng matplotlib
Tiêu tan
âm mưu
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
0Hình 10. Phân tán theo Plotly
Ở đây đã được bổ sung thêm các tính năng để chúng ta có thể thao tác trực tiếp với hình vẽ như khi di chuột vài điểm sẽ hiển thị giá trị của "Giá vé" và "Tuổi" để mọi người có thể thấy chi tiết hơn. Dựa vào biểu đồ này, chúng ta cũng thấy xu hướng giá tăng dưới 300 và những người già thường có xu hướng mua vé giá rẻ. Mọi người có thể vẽ thêm các biểu đồ để làm rõ hơn ví dụ như tuổi trung bình và giá cho Pclass
sinh ra biển
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
1Hình 11. Phân tán bởi Seaborn
Biểu đồ cột
âm mưu. Mỗi Pclass chúng ta sẽ hiển thị độ tuổi và giá vé trung bình bằng Bar Chart
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
2____13Hình 12. Biểu đồ thanh của Plotly
Thêm 2 thông số. color and colorscale để lựa chọn màu sắc hiển thị tùy chọn Seaborn
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
4Hình 13. Biểu đồ thanh của Seaborn
Lô đất phân phối
Lưu ý với đồ thị phân phối các giá trị của dữ liệu phải khác "NAN" nếu không thì phải giải quyết bằng cách fillna[] nhé. âm mưu
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
5Hình 14. Phân phối bởi Plotly
Matplotlib
from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode[connected=True]
import pandas as pd
6Hình 15. Phân phối bởi Matplotlib
Kết LuậnTrực quan hóa dữ liệu bằng Plotly look "cool" hơn đúng không ạ? . Quan trọng nhất vẫn là bạn sẽ thu được gì sau khi trực tiếp hóa dữ liệu thôi không đúng. Tuy nhiên mình cảm thấy Plotly khá là hữu ích bởi những tính năng của nó cũng như công việc sẽ thu hút người nghe hơn. Nhìn vào những hình ảnh động cảm giác vẫn hấp dẫn hơn là hình ảnh tĩnh phải không =]]]. Cảm ơn mn đã dành thời gian để đọc bài của mình. Mong được sự góp ý của mn dành cho bài viết của mình ạ
Thẩm quyền giải quyếthttps. // hướng tới khoa học dữ liệu. com/python-for-data-science-a-guide-to-data-visualization-with-plotly-969a59997d0c