Các biểu đồ hồi quy trong seaborn chủ yếu nhằm mục đích thêm hướng dẫn trực quan giúp nhấn mạnh các mẫu trong tập dữ liệu trong quá trình phân tích dữ liệu khám phá. Các biểu đồ hồi quy như tên gợi ý tạo ra một đường hồi quy giữa 2 tham số và giúp hình dung các mối quan hệ tuyến tính của chúng. Bài viết này đề cập đến những loại ô đó trong seaborn và chỉ ra những cách có thể được điều chỉnh để thay đổi kích thước, khía cạnh, tỷ lệ, v.v. của những mảnh đất như vậy
Seaborn không chỉ là thư viện trực quan mà còn là nhà cung cấp bộ dữ liệu tích hợp. Ở đây, chúng tôi sẽ làm việc với một trong những bộ dữ liệu như vậy trong seaborn có tên là 'mẹo'. Bộ dữ liệu về tiền boa chứa thông tin về những người có thể đã ăn ở nhà hàng và liệu họ có để lại tiền boa hay không. Nó cũng cung cấp thông tin về giới tính của mọi người, họ có hút thuốc không, ngày, giờ, v.v.
Trước tiên chúng ta hãy xem tập dữ liệu trước khi bắt đầu với các biểu đồ hồi quy
Tải tập dữ liệu
Python3
# import the library
import
seaborn as sns
# load the dataset
dataset
=
sns.load_dataset[
'tips'
]
import
1
import
2
Đầu ra
Bây giờ chúng ta hãy bắt đầu với các biểu đồ hồi quy trong seaborn.
Có thể dễ dàng thực hiện các biểu đồ hồi quy trong seaborn với sự trợ giúp của hàm lmplot[]. lmplot[] có thể hiểu là một hàm về cơ bản tạo ra một biểu đồ mô hình tuyến tính. lmplot[] tạo một biểu đồ hồi quy tuyến tính rất đơn giản. Nó tạo ra một biểu đồ phân tán với sự phù hợp tuyến tính trên nó.
Biểu đồ tuyến tính đơn giản
Python3
import
3____14]
import
6=
import
8import
9=
seaborn as sns
1seaborn as sns
2=
seaborn as sns
4
Đầu ra
Giải thích
Thông số x và y được chỉ định để cung cấp giá trị cho trục x và y. sns. set_style[] được sử dụng để có lưới ở nền thay vì nền trắng mặc định. Tham số dữ liệu được sử dụng để chỉ định nguồn thông tin để vẽ các ô.
Biểu đồ tuyến tính có tham số bổ sung
Python3
import
3____14]
import
6=
import
8import
9=
seaborn as sns
1seaborn as sns
2=
6
7______38____6# load the dataset
0# load the dataset
1=
# load the dataset
3# load the dataset
4# load the dataset
5# load the dataset
6# load the dataset
7
Đầu ra
Giải thích
Để có khả năng phân tích tốt hơn khi sử dụng các biểu đồ này, chúng ta có thể chỉ định màu sắc để có sự phân tách rõ ràng trong biểu đồ của mình như . Vì chúng tôi có hai danh mục riêng biệt, chúng tôi cần chuyển vào danh sách các ký hiệu trong khi chỉ định điểm đánh dấu.
Đặt kích thước và màu sắc của ô
Python3
import
3____14]
import
6=
import
8import
9=
seaborn as sns
1seaborn as sns
2=
dataset
9=
# load the dataset
0=
2
7_______64=
# load the dataset
3# load the dataset
4# load the dataset
5# load the dataset
6sns.load_dataset[
0=
sns.load_dataset[
2sns.load_dataset[
3sns.load_dataset[
4sns.load_dataset[
5sns.load_dataset[
6
7__sns.load_dataset[
8=
'tips'
0]
Đầu ra
Giải thích
Trong ví dụ này, điều mà seaborn đang làm là gọi các tham số matplotlib một cách gián tiếp để tác động đến các biểu đồ phân tán. Chúng tôi chỉ định một tham số gọi là scatter_kws. Chúng ta phải lưu ý rằng tham số scatter_kws chỉ thay đổi kích thước của các ô phân tán chứ không phải các đường hồi quy. Các đường hồi quy vẫn còn nguyên. Chúng tôi cũng sử dụng tham số bảng màu để thay đổi màu của ô. Phần còn lại của những thứ vẫn giống như được giải thích trong ví dụ đầu tiên.
Hiển thị nhiều ô
Python3
import
6=
import
8import
9=
seaborn as sns
1seaborn as sns
2=
6
7_______92____6# load the dataset
0]
5=
]
7]
8=
import
00]
Đầu ra
Giải thích
Trong đoạn mã trên, chúng tôi vẽ nhiều ô bằng cách chỉ định phân tách với sự trợ giúp của các hàng và cột. Mỗi hàng chứa các lô tiền boa so với tổng hóa đơn cho các thời điểm khác nhau được chỉ định trong tập dữ liệu. Mỗi cột chứa các lô tiền boa so với tổng hóa đơn cho các giới tính khác nhau. Một sự phân tách khác được thực hiện bằng cách chỉ định tham số màu sắc trên cơ sở liệu người đó có hút thuốc hay không.
Kích thước và tỷ lệ khung hình của các ô
Python3
import
6=
import
8import
9=
seaborn as sns
1seaborn as sns
2=
import
10=
# load the dataset
0=
2
7import
15______6]
7]
8=
import
00import
21=
import
23=
2