Mô phỏng hồi quy tuyến tính Python

Hồi quy tuyến tính là một mô hình cổ điển trong thống kê. Một cái nhìn mới về nó được cung cấp thông qua lăng kính học tập phổ quát. Khi áp dụng học phổ quát vào hồi quy tuyến tính, lớp giả thuyết biểu thị nhãn y dưới dạng tổ hợp tuyến tính của vectơ đặc trưng x^Tθ, trong một lỗi Gaussian. Giải pháp Khả năng tối đa chuẩn hóa dự đoán [pNML] cho việc học phổ biến dữ liệu riêng lẻ có thể được biểu thị bằng phương pháp phân tích trong trường hợp này, cũng như phép đo khả năng học được liên quan của nó. Thật thú vị, tình huống mà số lượng tham số M thậm chí có thể lớn hơn số lượng mẫu đào tạo N có thể được kiểm tra. Đúng như dự đoán, trong trường hợp này, không thể đạt được khả năng học hỏi trong mọi tình huống; . Chúng tôi chứng minh kết quả bằng mô phỏng khớp đa thức với dữ liệu có bậc đa thức có thể lớn

Một mô phỏng tương tác đơn giản của Hồi quy tuyến tính. Nó vẽ dữ liệu theo số pixel trong cửa sổ OpenCV. Nói tóm lại, dự án này là sự hợp nhất của chương trình vẽ OpenCV và biểu đồ matplotlib

mô phỏng thống kê học máy python opencv

May mắn thay [hoặc không may] tôi chưa có nhu cầu tìm hiểu chi tiết về python để thực hiện các chức năng công việc chính của mình. Tuy nhiên, trăn đã thu được khá nhiều sức hút đối với khoa học dữ liệu và tin sinh học, vì vậy tôi đã quyết định tăng tốc trong một vài lần nghỉ giải lao mà tôi nhận được

Hôm nay tôi muốn xem việc dịch một số mã R rất cơ bản sang python đơn giản như thế nào. Cụ thể, tôi muốn xem cách thực hiện các thao tác sau trong python

  • Làm việc với khung dữ liệu
  • mô phỏng dữ liệu
  • Thực hiện hồi quy tuyến tính
  • lô dữ liệu

Đối với bài tập cụ thể này, tôi sẽ tạo một khung dữ liệu với dữ liệu mô phỏng được lấy từ phân phối chuẩn đa biến mà tôi sẽ biết các hệ số hồi quy thực và kiểm tra các hệ số này thông qua hồi quy tuyến tính

mã R

Trong R, đạt được điều này rất đơn giản với sự trợ giúp của thư viện MASS. Mã cho một mô phỏng đơn giản và hồi quy tuyến tính trông như thế này

Tóm lại, trong đoạn mã trên, trước tiên tôi mô phỏng một số dữ liệu bằng cách sử dụng hàm mvrnorm[] sẽ rút ra các số ngẫu nhiên từ phân phối đa biến cho hai biến với mean=0, var[x1]=var[y]=1 và cov[y,x1 . 5. Hồi quy tuyến tính sau đó phù hợp với hàm lm[]summary[] cho phép kiểm tra kết quả

Coefficients:
Estimate Std. Error t value Pr[>|t|]
[Intercept] -0.00428 0.01229 -0.348 0.728
x1 0.50926 0.01218 41.801 |t|]
[Intercept] 1.99545 0.01261 158.29

Chủ Đề