Bảng cheat phân tán

Để chụp ảnh màn hình bằng máy Mac, hãy nhấn tổ hợp phím Command + Shift + 3 rồi nhả tất cả các phím để chụp toàn bộ màn hình hoặc nhấn Command + Shift + 4 rồi nhấn và kéo chuột qua khu vực bạn muốn chụp

iPhone/iPad

Để chụp ảnh màn hình bằng iPhone hoặc iPod Touch, hãy nhấn và giữ nút ngủ/thức rồi bấm vào nút Trang chủ

Android

Chụp ảnh màn hình với Android 4. 0 [Ice Cream Sandwich] chỉ cần nhấn và giữ nút Giảm âm lượng và Nguồn cùng lúc

C++ cheat sheet - phần 1

18 tháng 11, 2012 - 1444 lượt xem

C++

Tác giả Matt Mahoney, mmahoney@cs. Phù hợp. giáo dục.
Đội ngũ giảng viên TechMaster biên soạn, định dạng lại để dễ đọc hơn.


Thư viện chuẩn C++ – phần 2

TIỀN XỬ LÝ

// Comment to end of line
                          /* Multi-line comment */
#include <stdio.h>        // Insert standard header file
#include "myfile.h"       // Insert file in current directory
#define X some text       // Replace X with some text
#define F[a,b] a+b        // Replace F[1,2] with 1+2
#define X 
  some text               // Line continuation
#undef X                  // Remove definition
#if defined[X]            // Condional compilation [#ifdef X]
#else                     // Optional [#ifndef X or #if !defined[X]]
#endif                    // Required after #if, #ifdef

CHỮ

255, 0377, 0xff           // Integers [decimal, octal, hex]
2147483647L, 0x7fffffffl  // Long [32-bit] integers
123.0, 1.23e2             // double [real] numbers
'a', '141', 'x61'       // Character [literal, octal, hex]
'n', '\', ''', '"'    // Newline, backslash, single quote, double quote
"stringn"                // Array of characters ending with newline and 

 

bình luận

* Vui lòng đăng nhập trước khi bình luận.

  0 Thích

chia sẻ

Hướng dẫn về ký hiệu cờ vua đại số - cách đặt tên các ô vuông, ý nghĩa của các ký hiệu khác nhau và cách đánh dấu một trò chơi để chia sẻ với người khác

17 tháng 3 14, cập nhật 12 tháng 5 16

Bảng cheat Poker

Xếp hạng ván bài, tỷ lệ cược và cách chơi cơ bản đối với Texas Holdem, Rút năm lá bài và Bẩy lá bài

5 ngày 13 tháng 4, cập nhật ngày 11 tháng 3 20

Bảng cheat cờ vua

Cách quân cờ di chuyển và một vài mô tả về các thuật ngữ thường dùng

4 tháng 11, 11, cập nhật 18 tháng 9, 16

Bảng Cheat Xếp hạng Ván bài Poker

Xếp hạng quân bài và ván bài, cộng với quy tắc tiebreak của bài xì phé tiêu chuẩn [5 quân bài]. Không liệt kê các quy tắc của các loại trò chơi poker khác nhau

10 tháng 1 13, cập nhật 11 tháng 5 16

Skyrim - Mage's Cheatsheet Cheat Sheet

Danh sách các phép thuật trong The Elder Scrolls V - Skyrim. Tôi thấy khó chịu khi những phép thuật bạn đã học không được đánh dấu trong danh sách bán của nhà cung cấp. Điều này có thể giúp mua chính tả

Nhóm người bảo trợ cercanos a Mozart contactados por su esposa después de su muerte. Viajamos por Europa và tài chính la creación de "la Lacrimosa del Requiem"

Bảng gian lận trò chơi

Thẻ hàng đầu trong trò chơi

Trò chơi máy tính

Trò chơi trên bàn

Các môn thể thao

Sở thích

Lý thuyết trò chơi là nghiên cứu về các mô hình toán học về xung đột và hợp tác giữa những người ra quyết định hợp lý thông minh. Lý thuyết trò chơi chủ yếu được sử dụng trong kinh tế học, khoa học chính trị và tâm lý học, cũng như logic, khoa học máy tính và sinh học

Mục lục

  • Đại diện trò chơi
  • Phân loại trò chơi
  • Trò chơi thường được biết đến
  • Trạng thái cân bằng Nash
  • Trò chơi dạng mở rộng
  • Trò chơi lặp đi lặp lại
  • Trò chơi Bayesian
  • game liên quân
  • Lựa chọn xã hội
  • thiết kế cơ chế
    • VCG
  • kinh tế tiền điện tử
  • Tài nguyên

Đại diện trò chơi

người chơi. những người ra quyết định là ai?

  • Mọi người?

hành động. người chơi có thể làm gì?

  • Nhập một giá thầu trong một cuộc đấu giá?

hoàn trả. điều gì thúc đẩy người chơi?

  • Họ có quan tâm đến một số lợi nhuận?

hình thức bình thường

  • Liệt kê những phần thưởng mà người chơi nhận được như là một chức năng của hành động của họ
  • Không kết hợp bất kỳ khái niệm nào về trình tự hoặc thời gian của các hành động của người chơi
  • Thường được biểu diễn bằng ma trận
Giữ im lặngPhản bộiGiữ im lặng-1,-1-3,0Phản bội0,-3-2,-2

hình thức mở rộng

  • Bao gồm thời gian di chuyển
  • Thường được đại diện bởi một cái cây

Trò chơi dạng mở rộng

Biến đổi afin dương. au + b, trong đó a > 0 và b là một số thực bất kỳ. Các tiện ích kỳ vọng giống hệt với các phép biến đổi affine dương

Phân loại trò chơi

Trò chơi đồng thời [a. k. a. Trò chơi chiến lược] - trò chơi mà cả hai người chơi di chuyển đồng thời hoặc nếu họ không di chuyển đồng thời, những người chơi sau sẽ không biết về hành động của những người chơi trước [làm cho họ đồng thời một cách hiệu quả]

Dạng chuẩn thường được sử dụng để biểu diễn các trò chơi đồng thời

Trò chơi tuần tự [a. k. a. Trò chơi mở rộng] - trò chơi mà người chơi sau có một số kiến ​​thức về các hành động trước đó

Hình thức mở rộng thường được sử dụng để đại diện cho các trò chơi tuần tự

Trò chơi hợp tác - trò chơi mà người chơi có thể hình thành các cam kết ràng buộc được thi hành từ bên ngoài [e. g. thông qua luật hợp đồng]. Trò chơi không hợp tác - trò chơi mà người chơi không thể thành lập liên minh hoặc nếu tất cả các thỏa thuận cần phải tự thực thi [e. g. thông qua các mối đe dọa đáng tin cậy]. Trò chơi có tổng bằng không - trò chơi trong đó lợi ích đạt được hoặc mất đi của mỗi người tham gia được cân bằng chính xác với tổn thất hoặc lợi ích của lợi ích của những người tham gia khác. Trò chơi có tổng khác không - trò chơi trong đó tổng lãi và lỗ của các bên tương tác có thể nhỏ hơn hoặc lớn hơn 0. Trò chơi thông tin hoàn hảo - trò chơi trong đó tất cả người chơi đều biết nước đi mà tất cả người chơi khác đã thực hiện trước đó. Trò chơi thông tin không hoàn hảo - trò chơi trong đó một số người chơi không biết các nước đi mà người chơi khác đã thực hiện trước đó. Trò chơi thông tin đầy đủ - trò chơi trong đó tất cả người chơi biết các chiến lược và phần thưởng dành cho những người chơi khác. Trò chơi thông tin không đầy đủ - trò chơi trong đó một số người chơi không biết các chiến lược hoặc phần thưởng dành cho những người chơi khác. Trò chơi hữu hạn - trò chơi kéo dài với số lần di chuyển hữu hạn. Trò chơi vô hạn - trò chơi kéo dài với số lần di chuyển vô hạn

Trò chơi thường được biết đến

Thế tiến thoái lưỡng nan của người tù

Giữ im lặngPhản bộiGiữ im lặng-1,-1-3,0Phản bội0,-3-2,-2
  • Có 1 ĐB
    • Cả hai người chơi đều phản bội
  • Đây là một chiến lược chiếm ưu thế NE
  • Đó cũng là kết quả tối ưu phi Pareto duy nhất trong trò chơi này

Trò chơi phối hợp

  • Trận chiến xác thịt
  • săn hươu
  • Trò chơi phối hợp thuần túy

đồng xu phù hợp

Chơi ngửaChơi sấpChơi ngửa1,-1-1,1Chơi sấp-1,11,-1
  • Có 1 ĐB
    • Chiến lược hỗn hợp NE. mỗi người chơi chọn mặt ngửa hoặc mặt sấp với xác suất 0. 5
  • Đó là một trò chơi có tổng bằng không

Trận chiến xác thịt

Vào operaVào bóng đáVào opera3,20,0Vào bóng đá0,02,3
  • Có 3 ĐB
    • Cả hai người chơi đi xem opera
    • Cả hai người chơi đi đến bóng đá
    • Chiến lược hỗn hợp NE. Anh ấy đi xem opera với xác suất 3/5, Cô ấy đi xem opera với xác suất 2/5

săn hươu

Săn hươuSăn thỏSăn hươu2,20,1Săn thỏ1,01,1
  • Có 3 ĐB
    • Cả hai người chơi đều săn hươu
    • Cả hai người chơi săn thỏ
    • Chiến lược hỗn hợp NE. Anh săn hươu với xác suất 1/2, Cô săn hươu với xác suất 1/2

Trò chơi phối hợp thuần túy

Đi dự tiệcỞ nhà Đi dự tiệc10,100,0Ở nhà0,05,5
  • Có 3 ĐB
    • Cả hai người chơi đi dự tiệc
    • Cả hai cầu thủ ở nhà
    • Chiến lược hỗn hợp NE. Anh ấy dự tiệc với xác suất 1/3, Cô ấy dự tiệc với xác suất 1/3

Tiền miễn phí

Chơi đầuChơi đuôiChơi đầu1,10,0Chơi đuôi0,00,0
  • Có 2 NE [một trường hợp hiếm khi có số NE chẵn, xem Định lý Oddness]
    • Cả hai người chơi chơi đầu
    • Cả hai người chơi chơi đuôi

trò chơi gà

Xoay ThẳngSwerve0,0-1,1Straight1,-1-10,-10
  • Trò chơi chống phối hợp - người chơi cùng có lợi khi chơi các chiến lược khác nhau
  • Có 3 ĐB
    • Anh rẽ, cô đi thẳng
    • Anh đi thẳng, cô rẽ
    • Chiến lược hỗn hợp NE. Anh ấy đổi hướng với xác suất 9/10, Cô ấy đổi hướng với xác suất 9/10

Trò chơi con rết

  • SPE. mỗi người chơi chọn đào tẩu ở mọi cơ hội

Trạng thái cân bằng Nash

Cân bằng Nash - một tập hợp các chiến lược, một chiến lược dành cho mỗi người chơi, sao cho không người chơi nào có động cơ thay đổi chiến lược của mình dựa trên những gì người chơi khác đang làm

Cân bằng Nash [định nghĩa thay thế] - một tập hợp các chiến lược, mỗi chiến lược dành cho mỗi người chơi, sao cho chiến lược của mỗi người chơi là phản ứng tốt nhất với những gì người chơi khác đang làm

Phản hồi tốt nhất - một chiến lược mà người chơi không thể đạt được nhiều tiện ích hơn từ việc chuyển sang một chiến lược khác, dựa trên những gì tất cả những người chơi khác đang làm

Chiến lược hỗn hợp - phân phối xác suất trên hai hoặc nhiều chiến lược thuần túy, nghĩa là người chơi chọn ngẫu nhiên trong số các tùy chọn của họ ở trạng thái cân bằng

Chiến lược hỗn hợp Cân bằng Nash - một tập hợp các chiến lược hỗn hợp, một chiến lược dành cho mỗi người chơi, sao cho không người chơi nào có động cơ thay đổi chiến lược của mình dựa trên những gì người chơi khác đang làm

Chiến lược chiếm ưu thế - một chiến lược luôn tốt hơn bất kỳ chiến lược nào khác, đối với bất kỳ hành động nào của những người chơi khác

  • Chiến lược thống trị nghiêm ngặt - giống như Chiến lược thống trị
  • Chiến lược chiếm ưu thế yếu - một chiến lược luôn tốt hơn hoặc bằng bất kỳ chiến lược nào khác, đối với bất kỳ hành động nào của những người chơi khác

Chiến lược vượt trội Cân bằng Nash [điểm cân bằng trong các chiến lược vượt trội] - trạng thái cân bằng Nash trong đó tất cả các chiến lược đều chiếm ưu thế hoàn toàn. Nếu nó tồn tại có thể được tìm thấy bằng cách loại bỏ các chiến lược bị chi phối nghiêm ngặt

Chiến lược thống trị - một chiến lược, như vậy, bất kể những gì người chơi khác làm, chiến lược kiếm cho người chơi một khoản tiền nhỏ hơn so với một số chiến lược khác

  • Chiến lược thống trị nghiêm ngặt - giống như Chiến lược thống trị
  • Chiến lược thống trị yếu - một chiến lược, như vậy, bất kể những gì người chơi khác làm, chiến lược kiếm được một người chơi nhỏ hơn hoặc bằng một số phần thưởng chiến lược khác

Trò chơi con cân bằng hoàn hảo

Cân bằng Bayes-Nash

Cốt lõi [tương tự như trạng thái cân bằng Nash cho các trò chơi liên minh]

Cân bằng Nash cho các loại trò chơi khác nhau

Đồng thờiSequentialCompleteNashSubgame Perfect NashIncompleteBayesian NashPerfect Bayesian Nash

Định lý Nash

Mọi trò chơi hữu hạn, không hợp tác của hai hay nhiều người chơi đều có một chiến lược hỗn hợp Cân bằng Nash. [John Nash, 1950]

Tối ưu Pareto

Kết quả tối ưu Pareto - một kết quả, sao cho không có kết quả nào khác vượt trội Pareto. Một kết quả o kết quả chiếm ưu thế Pareto o' nếu nó ít nhất cũng tốt cho mọi người chơi như kết quả o' và có một số người chơi thực sự thích o hơn o'

Định lý kỳ quặc

Hầu như tất cả các trò chơi hữu hạn đều có số nghiệm hữu hạn và số nghiệm đó cũng là số lẻ. [Robert Wilson, 1971]

Trò chơi dạng mở rộng

Thông tin hoàn hảo Trò chơi dạng mở rộng

Tất cả người chơi đều biết các nước đi trước đây của tất cả người chơi khác

Mỗi trò chơi ở dạng mở rộng có thể được chuyển đổi thành dạng bình thường. Sự biến đổi ngược lại không phải lúc nào cũng có thể xảy ra, e. g. đồng xu phù hợp không thể được viết như một trò chơi hình thức mở rộng thông tin hoàn hảo

định lý

Mọi trò chơi thông tin hoàn hảo ở dạng mở rộng đều có một chiến lược thuần túy Cân bằng Nash

Thông tin không hoàn hảo Trò chơi dạng mở rộng

Người chơi 2 không biết nước đi của Người chơi 1

Quy nạp ngược - xác định trạng thái cân bằng trong các cây ở dưới cùng và áp dụng chúng khi một người di chuyển lên trên cây

Trò chơi con cân bằng hoàn hảo - Trạng thái cân bằng Nash thể hiện trạng thái cân bằng Nash của mọi trò chơi con trong trò chơi gốc. Đó là một sàng lọc của trạng thái cân bằng Nash giúp loại bỏ các mối đe dọa không đáng tin cậy

Mối đe dọa không đáng tin cậy - mối đe dọa do người chơi tạo ra trong một trò chơi dạng mở rộng mà người chơi sẽ không có lợi nhất khi thực hiện. Hy vọng là mối đe dọa được tin tưởng trong trường hợp nào không cần phải thực hiện nó. Mặc dù cân bằng Nash có thể phụ thuộc vào các mối đe dọa không đáng tin cậy, nhưng Quy nạp ngược loại bỏ chúng

Trò chơi lặp đi lặp lại

Trò chơi lặp lại - một trò chơi dạng mở rộng bao gồm một số lần lặp lại của một số trò chơi cơ bản, được gọi là trò chơi theo giai đoạn. Trò chơi sân khấu thường là một trong những trò chơi 2 người được nghiên cứu kỹ lưỡng

Hệ số chiết khấu - một số từ 0 đến 1 biểu thị giá trị thời gian tiêu thụ và xác suất tiếp tục. Hệ số chiết khấu cao hơn có nghĩa là kiên nhẫn hơn và cơ hội sống sót cao hơn trong giai đoạn tiếp theo

Nguyên tắc sai lệch một lần - trong các trò chơi lặp lại hữu hạn hoặc vô hạn với chiết khấu, một tập hợp các chiến lược là một trò chơi con cân bằng hoàn hảo nếu không người chơi nào có thể có lợi từ chiến lược của mình ở một giai đoạn duy nhất và duy trì chiến lược của mình ở mọi nơi khác

Kích hoạt nghiệt ngã

  • Chơi một số hồ sơ chiến lược với tỷ lệ hoàn trả cao hơn NE
  • Nếu ai lệch thì chơi NE mãi

Hồ sơ chiến lược nơi mọi người chơi kích hoạt nghiệt ngã là một trạng thái cân bằng hoàn hảo của trò chơi con

Ăn miếng trả miếng - một chiến lược trong thế tiến thoái lưỡng nan của người tù lặp đi lặp lại vô tận

  • Bắt đầu bằng cách hợp tác
  • Đối với tất cả các giai đoạn sau, hãy sao chép chiến lược của đối thủ từ giai đoạn trước

Hồ sơ chiến lược nơi mọi người chơi ăn miếng trả miếng không phải là trạng thái cân bằng hoàn hảo của trò chơi phụ

Định lý dân gian

  • Lấy điểm cân bằng Nash từ trò chơi trên sân khấu
  • Hãy xem xét bất kỳ tập hợp chiến lược thay thế nào sao cho lợi ích mong đợi của những chiến lược đó trong trò chơi theo giai đoạn là lớn hơn hoàn toàn đối với tất cả người chơi
  • Nếu hệ số chiết khấu đủ cao, thì tồn tại trạng thái cân bằng hoàn hảo của trò chơi con trong đó người chơi sử dụng các chiến lược thay thế đó trên đường cân bằng

Ý nghĩa của định lý dân gian

  • Nếu mục đích của trạng thái cân bằng là dự đoán hoặc giải thích kết quả, thì trạng thái cân bằng hoàn hảo của trò chơi con dự đoán và giải thích mọi thứ
  • Dự đoán và giải thích mọi thứ về cơ bản là dự đoán và không giải thích gì cả

Trò chơi ngẫu nhiên - tổng quát hóa các trò chơi lặp đi lặp lại

  • các tác nhân liên tục chơi trò chơi từ một tập hợp các trò chơi dạng bình thường
  • trò chơi được chơi ở bất kỳ lần lặp nào phụ thuộc vào trò chơi đã chơi trước đó và vào các hành động được thực hiện bởi tất cả các tác nhân trong trò chơi đó

Học trong các trò chơi lặp đi lặp lại

Chơi hư cấu. mỗi người chơi duy trì niềm tin rõ ràng về những người chơi khác

  • Khởi tạo niềm tin về chiến lược của đối thủ
  • Mỗi lượt
    • Chơi phản ứng tốt nhất với chiến lược đánh giá của đối thủ
    • Quan sát lối chơi thực tế của đối thủ và cập nhật niềm tin cho phù hợp

Học tập không hối tiếc

Trò chơi Bayesian

Trò chơi Bayesian [Trò chơi thông tin không đầy đủ] - một trò chơi trong đó người chơi có thông tin không đầy đủ về chiến lược và phần thưởng của những người chơi khác, nhưng họ có niềm tin với xác suất đã biết. Nó có thể được mô hình hóa như một trò chơi dạng bình thường với sự khác biệt là mỗi người chơi có nhiều loại với xác suất đã biết [được gọi là niềm tin chung trước đó]

Cân bằng Bayes-Nash [Bayesian Nash Equilibrium] - một tập hợp các chiến lược, một chiến lược dành cho từng loại người chơi, sao cho không loại nào có động cơ thay đổi chiến lược của mình dựa trên niềm tin về các loại và những gì các loại khác đang làm

3 giai đoạn của trò chơi Bayesian

  • Ex-ante - người chơi không biết gì về loại thực tế của bất kỳ ai
  • Tạm thời - người chơi biết loại của mình nhưng không biết loại của những người chơi khác
  • Ex-post - người chơi biết tất cả các loại người chơi. Việc đưa ra lựa chọn ở giai đoạn này cho người chơi tương đương với việc đưa ra lựa chọn trong trò chơi thông tin đầy đủ.

Chiến lược chiếm ưu thế trước đó - một chiến lược dành cho một người chơi sao cho một chiến lược thay thế cho người chơi đó mang lại phần thưởng lớn hơn cho người chơi đó bất kể tất cả các chiến lược của người chơi khác

Chiến lược chiếm ưu thế tạm thời - một chiến lược cho một loại sao cho một chiến lược thay thế cho loại đó mang lại phần thưởng lớn hơn cho loại đó bất kể tất cả các chiến lược của người chơi khác

Chiến lược chiếm ưu thế tạm thời ngụ ý các chiến lược chiếm ưu thế trước đó. Điều ngược lại không phải lúc nào cũng đúng

Định lý thanh lọc

Hầu như tất cả các cân bằng Nash chiến lược hỗn hợp trong một trò chơi thông tin đầy đủ là giới hạn của chiến lược thuần túy Cân bằng Bayesian Nash trong một trò chơi thông tin không đầy đủ hội tụ trong trò chơi thông tin đầy đủ

Những trò chơi như vậy được gọi là Bayesian vì phân tích xác suất vốn có trong trò chơi. Người chơi có niềm tin ban đầu về loại của mỗi người chơi [trong đó niềm tin là phân phối xác suất đối với các loại có thể có đối với người chơi] và có thể cập nhật niềm tin của họ theo quy tắc Bayes khi trò chơi diễn ra trong trò chơi. e. niềm tin của một người chơi về loại người chơi khác có thể thay đổi dựa trên các hành động họ đã chơi

Định lý Bayes

p[A. B] = P[B. A] * P [A] / P [B], trong đó

  • p[A. B] là một xác suất có điều kiện. khả năng xảy ra sự kiện A nếu B đúng
  • P[B. A] cũng là một xác suất có điều kiện. khả năng xảy ra sự kiện B nếu A đúng
  • P[A] và P[B] là xác suất quan sát A và B độc lập với nhau;

Quy tắc Bayes

Định lý Bayes ở dạng tỷ lệ cược là

O[A1. A2. B] = O[A1. A2] * Λ[A1. A2. B], ở đâu

Λ[A1. A2. B] = P[B. A1] / P[B. A2] - Hệ số Bayes hoặc tỷ lệ khả dĩ, và

O[A1. A2] = P[A1] / P[A2] - tỷ lệ giữa các sự kiện

Vì vậy, quy tắc nói rằng tỷ lệ cược sau là tỷ lệ cược trước nhân với yếu tố Bayes, hay nói cách khác, tỷ lệ sau tỷ lệ thuận với xác suất của thời gian trước

game liên quân

Game liên quân được đưa ra bằng cách chỉ định một giá trị cho mọi liên quân. Về mặt hình thức, trò chơi liên quân bao gồm một tập hữu hạn N người chơi, được gọi là đại liên minh, và một chức năng đặc trưng v. 2 ^ N -> ℝ từ tập hợp tất cả các liên minh có thể có của người chơi thành tập hợp các khoản thanh toán thỏa mãn v[∅]=0

Hai cách để phân bổ tiền chi trả

  • giá trị Shapley. dựa trên đóng góp cận biên - mỗi người chơi đóng góp gì cho mỗi liên minh có thể có;
    • phân phối "công bằng"
  • Cốt lõi. dựa trên các mối đe dọa liên minh - mỗi liên minh phải nhận được ít nhất những gì nó có thể tạo ra một mình;
    • phân phối "ổn định"

Giá trị Shapley phân bổ giá trị của một nhóm theo tính toán đóng góp cận biên

trong đó tổng dao động trên tất cả. N. thứ tự R của người chơi và

là tập hợp người chơi trong N đứng trước i theo thứ tự R.

định lý

Đối với bất kỳ trò chơi liên minh nào, có một cách phân chia tiền thưởng duy nhất [Giá trị Shapley] phân chia toàn bộ tiền thưởng của liên minh lớn và thỏa mãn 3 tiên đề

  • Đối diện. nếu người chơi có thể hoán đổi cho nhau thì họ sẽ được phân bổ giống nhau
  • người chơi giả. nếu số tiền mà một người chơi đóng góp cho bất kỳ liên minh nào là 0, thì phân bổ của anh ta là 0
  • gây nghiện. nếu chúng ta có thể tách trò chơi thành hai trò chơi con sao cho giá trị trong mỗi liên minh là tổng giá trị trong hai trò chơi con, thì phần phân bổ trong trò chơi phải bằng tổng phần bổ sung trong hai trò chơi con

Cốt lõi - tập hợp các vectơ hoàn trả theo đó không có liên minh nào có giá trị lớn hơn tổng số tiền chi trả của các thành viên. Do đó, không liên minh nào có động cơ rời khỏi liên minh lớn và nhận được phần thưởng lớn hơn

  • Nó tương tự như cân bằng Nash, ngoại trừ việc nó cho phép sai lệch bởi các nhóm tác nhân

Một trò chơi đơn giản nếu đối với tất cả các liên minh, giá trị của liên minh là 0 hoặc 1

Một người chơi là người chơi có quyền phủ quyết nếu giá trị của tất cả các liên minh không liên quan đến người chơi đó là 0

định lý

Trong một trò chơi đơn giản, lõi trống nếu không có người chơi phủ quyết. Nếu có những người chơi có quyền phủ quyết, lõi bao gồm tất cả các véc tơ hoàn trả trong đó những người chơi không có quyền phủ quyết nhận được 0

Một trò chơi là lồi nếu hàm đặc trưng v của nó là siêu mô đun

nghĩa là, "các động lực để tham gia liên minh tăng lên khi liên minh phát triển"

định lý

Mỗi trò chơi lồi có một lõi không trống

Trong mọi trò chơi lồi, giá trị Shapley là cốt lõi

Lựa chọn xã hội

Hàm lựa chọn xã hội - một hàm, được cung cấp một tập hợp các thứ tự tuyến tính trên các kết quả, cho biết kết quả nào sẽ được chọn

Hàm phúc lợi xã hội - một hàm, được cung cấp một tập hợp các thứ tự tuyến tính trên các kết quả, cho biết nên chọn thứ tự nào

Đề án bỏ phiếu

  • Đa số - chọn kết quả được hầu hết mọi người ưa thích nhất
  • bỏ phiếu tích lũy
    • phân phối e. g. , 5 phiếu mỗi
    • có thể bỏ phiếu cho cùng một kết quả nhiều lần
  • Bỏ phiếu tán thành - bỏ phiếu cho bao nhiêu kết quả mà bạn "thích" [được sử dụng. g. trong việc bầu thành viên mới vào một câu lạc bộ hoặc hiệp hội]
  • Đa số có loại trừ ["bỏ phiếu ngay lập tức", "bỏ phiếu có thể chuyển nhượng"]
    • nếu một số kết quả có đa số, đó là người chiến thắng
    • nếu không, kết quả có ít phiếu bầu nhất sẽ bị loại [có thể cần một số thủ tục hòa giải]
    • lặp lại cho đến khi có một người chiến thắng
  • Quy tắc Borda, Bá tước Borda
    • chỉ định mỗi kết quả một số
    • kết quả được ưu tiên nhất nhận được số điểm là _______, kết quả được ưu tiên nhất tiếp theo là _______8, cho đến kết quả thứ 9 là 0
    • tính tổng điểm cho từng kết quả và chọn kết quả có điểm cao nhất
  • loại bỏ liên tiếp
    • trước, quyết định thứ tự các lựa chọn thay thế
    • mọi người bỏ phiếu cho người đầu tiên hoặc thứ hai, và người thua cuộc bị loại

Người chiến thắng Condorcet - một kết quả được ưa thích hơn mọi kết quả khác khi so sánh theo quy tắc đa số theo cặp. Nó không tồn tại khi có chu kỳ Condorcet e. g. một tình huống khi A đánh bại B, B đánh bại C và C đánh bại A

Tính nhất quán của Condorcet - nếu có một người chiến thắng Condorcet thì nó phải được chọn bởi chức năng lựa chọn xã hội

Định lý bất khả thi của Arrow

Bất kỳ chức năng phúc lợi xã hội nào trên 3 kết quả trở lên hiệu quả Pareto và độc lập với các lựa chọn thay thế không liên quan đều là độc tài. [Mũi tên Kenneth, 1951]

Hàm phúc lợi xã hội là hiệu quả Pareto nếu bất cứ khi nào tất cả các tác nhân đồng ý về thứ tự của hai kết quả, hàm phúc lợi xã hội sẽ chọn thứ tự đó

Hàm phúc lợi xã hội độc lập với các phương án không liên quan nếu thứ tự được chọn giữa hai kết quả chỉ phụ thuộc vào thứ tự tương đối mà chúng được đưa ra bởi các tác nhân

Chức năng phúc lợi xã hội là độc tài nếu tồn tại một tác nhân duy nhất có sở thích luôn xác định trật tự xã hội

Định lý bất khả thi Muller-Satterthwaite

Bất kỳ chức năng lựa chọn xã hội nào có hiệu quả Pareto yếu và đơn điệu đều là độc tài. [các định nghĩa tương tự như các thuật ngữ tương ứng cho chức năng phúc lợi xã hội]

Trước, hãy quyết định thứ tự các kết quả [e. g. theo phổ chính trị cánh tả cho các đảng chính trị]

Một nhóm các đại lý được cho là có sở thích đơn đỉnh nếu

  • Mỗi tác nhân có một kết quả lý tưởng trong tập hợp;
  • Đối với mỗi tác nhân, các kết quả khác xa với kết quả lý tưởng của anh ta ít được ưu tiên hơn

Bình chọn trung bình - trung bình của các kết quả ưa thích nhất được chọn

định lý

Với cách bỏ phiếu trung bình, người chiến thắng condorcet luôn tồn tại nếu có số lượng cử tri là số lẻ

thiết kế cơ chế

Thiết kế cơ chế [còn gọi là Lý thuyết trò chơi nghịch đảo] - một lĩnh vực trong lý thuyết trò chơi tập trung vào việc thiết kế cấu trúc trò chơi. g. chọn các hành động có sẵn cho người chơi và ánh xạ hồ sơ hành động tới kết quả, để tối ưu hóa cho các phẩm chất nhất định e. g. khả năng tương thích khuyến khích, hiệu quả Pareto, tính hợp lý cá nhân, v.v.

Cài đặt trò chơi - các thành phần của trò chơi mà chúng tôi, với tư cách là nhà thiết kế trò chơi, không thể kiểm soát, e. g. một tập hợp các tác nhân, một tập hợp các kết quả, các ưu tiên chung, v.v.

Cơ chế - các thành phần của trò chơi, khi được thêm vào cài đặt trò chơi tương ứng, sẽ biến nó thành một trò chơi. Một ví dụ là tập hợp các hành động có sẵn cho tổng đài viên và ánh xạ hồ sơ hành động tới kết quả

  • Cơ chế cho cài đặt trò chơi Bayesian
  • Cơ chế tiện ích có thể chuyển nhượng

Cơ chế cho cài đặt trò chơi Bayesian

Cài đặt trò chơi Bayesian - một bộ [N, O, Θ, p, u]

  • N - một tập hợp hữu hạn của n đại lý
  • O - một tập hợp các kết quả
  • Θ - Θ1 ×. × Θn - một tập hợp các vectơ loại khớp có thể
  • p - phân phối xác suất trên Θ [chung trước]
  • bạn = [u1,. ,un], trong đó ui. O × Θ ⇒ ℝ - hàm tiện ích cho mỗi người chơi i

Cơ chế cho cài đặt trò chơi Bayesian - là một cơ chế trong đó nhà thiết kế có thể chỉ định các bộ hành động cho tác nhân và ánh xạ tới kết quả, qua đó tác nhân có tiện ích. Do đó, nó là một cặp [A, M], trong đó

  • Một = A1 ×. × An, trong đó Ai - tập hợp các hành động có sẵn cho tác nhân i ∊ N
  • M. A ⇒ Π[O] ánh xạ từng hồ sơ hành động thành phân phối theo kết quả

Với cài đặt trò chơi Bayesian [N, O, Θ, p, u], một cơ chế [A, M] là một triển khai trong các chiến lược chi phối của hàm lựa chọn xã hội C [trên N và O] nếu đối với bất kỳ vectơ nào của các hàm tiện ích u

Với cài đặt trò chơi Bayesian [N, O, Θ, p, u], một cơ chế [A, M] là một triển khai ở trạng thái cân bằng Bayes-Nash của hàm lựa chọn xã hội C [trên N và O] nếu tồn tại Bayes- . ,θ]]

Cơ chế tiện ích có thể chuyển nhượng

Các đại lý có các tùy chọn gần như tuyến tính với tiện ích có thể chuyển nhượng trong trò chơi Bayesian có n người chơi khi tập hợp các kết quả là

O = X × ℝn

đối với một tập hợp X, nếu tiện ích của một tác nhân i đã cho loại liên kết θ có thể được viết

ui[o,θ] = ui[x,θ] - pi,

trong đó o = [x,p] là một phần tử của O và ui. X × Θ ⇒ ℝ

Cài đặt trò chơi tương ứng được gọi là Cài đặt chuẩn

Cơ chế trực tiếp trong cài đặt gần như tuyến tính [N, O = X × ℝn, Θ, p, u] là một cặp [χ, ρ] xác định kết quả cơ bản χ[θ] và hồ sơ thanh toán ρ[θ] = [p1 . ,pn[θ]]

  • χ xác định kết quả "phi tiền tệ"
  • ρi xác định khoản thanh toán "tiền tệ" [có thể âm] mà tác nhân i thực hiện cho cơ chế

Giá trị riêng tư

Các tùy chọn có giá trị riêng hoặc thỏa mãn tính độc lập tiện ích có điều kiện, nếu chức năng tiện ích của mỗi tác nhân i không phụ thuộc vào loại tác nhân khác, i. e nó có thể được viết là ui[o,θi]

Loại của một đại lý trở thành chức năng định giá của họ. Giá trị của i cho lựa chọn x ∊ X là vi[x] = ui[x, θi]

  • vi là số tiền tối đa tôi sẵn sàng trả để có được x

Định nghĩa thay thế của một cơ chế trực tiếp với các giá trị riêng tư

  • yêu cầu đại lý khai báo chức năng định giá vi. X ⇒ ℝ

Chất lượng cơ chế

Cơ chế trực tiếp - một cơ chế trong đó tập hợp các hành động chung bằng với tập hợp các loại khớp, i. e. các đại lý phải khai báo các loại của họ cho cơ chế

Cơ chế tương thích khuyến khích [còn gọi là Trung thực hoặc chứng minh chiến lược] - một cơ chế trực tiếp trong đó việc khai báo loại thực cho mọi tác nhân là một chiến lược chiếm ưu thế yếu Cân bằng Nash. Nói cách khác, mọi đại lý đều có giá tốt nhất hoặc ít nhất là không tệ hơn bằng cách trung thực, bất kể những gì người khác làm

  • Chiến lược chiếm ưu thế Tương thích với khuyến khích [DSIC] - tương tự như Tương thích với khuyến khích
  • Bayesian-Nash Incentive Tương thích [BNIC] - một cơ chế trực tiếp trong đó khai báo đúng loại cho mọi tác nhân là trạng thái cân bằng Bayes-Nash. Nói cách khác, mọi đại lý đều có kết quả tốt nhất hoặc ít nhất là không tệ hơn bằng cách trung thực, nếu tất cả những người khác đều hành động trung thực.

Một cơ chế tiện ích có thể chuyển nhượng là hiệu quả Pareto nghiêm ngặt, hoặc chỉ hiệu quả, nếu ở trạng thái cân bằng, nó chọn phương án tối đa hóa tổng tiện ích của các tác nhân, bỏ qua các khoản thanh toán bằng tiền

Cơ chế tiện ích có thể chuyển nhượng được cân bằng ngân sách khi, bất kể loại tác nhân là gì, ở trạng thái cân bằng, cơ chế thu và chi cùng một lượng tiền từ và cho các tác nhân

Một cơ chế tiện ích có thể chuyển nhượng là hợp lý cá nhân khi, ở trạng thái cân bằng, không có tác nhân nào thua khi tham gia vào cơ chế, i. e. định giá trừ đi khoản thanh toán cho mọi đại lý không âm

  • hợp lý cá nhân tạm thời - giữ cho mọi định giá có thể có của cá nhân, nhưng trung bình trên các định giá có thể có của các tác nhân khác
  • ex post - giữ cho mọi định giá có thể có của cá nhân và đối với các định giá có thể có của các đại lý khác

Một cơ chế có thể điều khiển được khi đối với mọi cấu hình định giá có thể, chức năng ánh xạ cơ chế có thể được tính toán trong thời gian đa thức

Cơ chế X là tối đa hóa doanh thu khi trong số các cơ chế khác thỏa mãn các ràng buộc khác, cơ chế X tối đa hóa tổng số tiền thanh toán của các đại lý ở trạng thái cân bằng

  • giảm thiểu doanh thu được định nghĩa tương tự

Một cơ chế là công bằng tối thiểu nếu nó "làm cho tác nhân kém hạnh phúc nhất trở nên hạnh phúc nhất"

Nguyên Tắc Mặc Khải

Bất kỳ chức năng lựa chọn xã hội nào có thể được thực hiện bởi bất kỳ cơ chế nào cũng có thể được thực hiện bởi một cơ chế trung thực, trực tiếp

Trong thiết kế cơ chế, nguyên tắc mặc khải là vô cùng quan trọng trong việc tìm ra giải pháp. Nhà nghiên cứu chỉ cần nhìn vào tập hợp các trạng thái cân bằng được đặc trưng bởi tính trung thực. Nghĩa là, nếu người thiết kế cơ chế muốn triển khai một số kết quả hoặc thuộc tính, anh ta có thể hạn chế tìm kiếm của mình đối với các cơ chế trong đó các tác nhân sẵn sàng tiết lộ thông tin cá nhân của họ cho người thiết kế cơ chế có kết quả hoặc thuộc tính đó. Nếu không có cơ chế trực tiếp và trung thực như vậy tồn tại, thì không có cơ chế nào có thể thực hiện kết quả/tính chất này. Bằng cách thu hẹp khu vực cần tìm kiếm, vấn đề tìm kiếm cơ chế trở nên dễ dàng hơn nhiều

Không thể thực hiện chiến lược chiếm ưu thế chung [Định lý Gibbard-Satterthwaite]

Đối với mỗi chức năng lựa chọn xã hội, một trong ba điều sau đây phải giữ

  • Đầu ra của hàm lựa chọn xã hội chỉ giới hạn ở 2 phương án
  • Chức năng lựa chọn xã hội là độc tài, tôi. e. tồn tại một đại lý đặc biệt có thể chọn kết quả chiến thắng
  • Báo cáo trung thực về sở thích là một chiến lược vượt trội cho mọi đại lý

Bỏ phiếu trung bình trong các miền một đỉnh là bằng chứng chiến lược [bất kỳ số liệu thống kê nào khác có thể được sử dụng thay vì e trung bình. g. tối đa hoặc tối thiểu]

Thương mại là bằng chứng về chiến lược

  • Một đại lý có một giá trị cá nhân để mua [hoặc bán] một hàng hóa không thể phân chia. Ông tuyên bố giá trị này một cách trung thực
  • Các đại lý khác tuyên bố họ sẵn sàng mua hay bán ở mức giá đó

VCG

Cơ chế Vickrey-Clarke-Groves [VCG] là một cách chung để các tác nhân tư lợi chọn một kết quả tối đa hóa phúc lợi xã hội. Nó hoạt động trong cài đặt tiện ích gần như tuyến tính, tôi. e. nơi thanh toán bằng tiền được áp dụng, mặc dù có một số hạn chế [được liệt kê bên dưới]

Ví dụ về nơi nó có thể được sử dụng

  • Tư nhân hóa - chính phủ tư nhân hóa một tiện ích công cộng như nhà máy điện không nhằm mục đích tối đa hóa doanh thu, mà để đảm bảo rằng người mua phù hợp sẽ thắng
  • Xây dựng một cây cầu - các doanh nghiệp ở hai bên bờ sông cần quyết định xem có nên xây cầu hay không và nếu có thì thanh toán như thế nào
  • Lên lịch các cuộc họp giữa những người coi trọng thời gian khác nhau và có thể không nói sự thật
  • Mua một con đường trong mạng - vận chuyển dọc theo đường sắt thuộc sở hữu tư nhân

phẩm chất

  • trung thực - có sự thật như một chiến lược thống trị
  • Hiệu quả Pareto - đưa ra lựa chọn hiệu quả [không bao gồm các khoản thanh toán]

Theo các giả định bổ sung về cài đặt, có thể đáp ứng

  • Cán cân ngân sách yếu
  • Tính hợp lý cá nhân tạm thời

Môn lịch sử

  • Vickrey là người đầu tiên định nghĩa chúng trong cài đặt đấu giá - đấu giá theo giá thứ 2, đấu giá Vickrey
  • Clarke đã khái quát hóa nó thành một lớp cài đặt tổng quát hơn và các cơ chế then chốt được xác định
  • Groves đã đưa ra một lớp tổng quát hơn về các cơ chế như vậy

Cơ chế Groves - một cơ chế tiện ích có thể chuyển nhượng trực tiếp sao cho

  • nó chọn kết quả tối đa hóa tổng tiện ích cho tất cả các tác nhân
  • mọi đại lý
    • được trả tiền cho tiện ích của mọi người khác theo phân bổ thực sự được chọn, ngoại trừ của chính anh ta [nhưng anh ta nhận trực tiếp như tiện ích]
    • được tính một số tiền dựa trên chức năng tùy ý của các giá trị của các đại lý khác

Cơ chế Vickrey-Clarke-Groves [VCG] [còn gọi là cơ chế Pivotal] - một cơ chế Groves sao cho

  • nó chọn kết quả tối đa hóa tổng tiện ích cho tất cả các tác nhân
  • mọi đại lý đều trả "chi phí xã hội" của mình
    • được trả tiền cho tiện ích của mọi người khác theo phân bổ thực sự được chọn, ngoại trừ của chính anh ta [nhưng anh ta nhận trực tiếp như tiện ích]
    • bị tính phí tiện ích của mọi người trên thế giới mà anh ta không tham gia

Trong cơ chế VCG

  • đại lý không ảnh hưởng đến kết quả trả 0
  • [quan trọng] các đại lý làm cho mọi thứ trở nên tồi tệ hơn cho người khác bằng cách tồn tại, trả nhiều hơn 0
  • [quan trọng] các đại lý làm mọi thứ tốt hơn cho người khác bằng cách hiện có, được trả tiền

định lý

Nói thật là một chiến lược chiếm ưu thế trong bất kỳ cơ chế Groves nào, kể cả cơ chế xoay trục [cơ chế VCG]

Định lý [Green-Laffont]

Giả sử rằng đối với tất cả các tác nhân, bất kỳ chức năng tiện ích nào cũng có thể. Sau đó, một cơ chế hiệu quả Pareto có báo cáo trung thực như một chiến lược chi phối cho tất cả các tác nhân và sở thích chỉ khi đó là cơ chế Groves

Hạn chế của VCG

Sự riêng tư

VCG yêu cầu đại lý tiết lộ đầy đủ thông tin cá nhân. Thông tin cá nhân này có thể có giá trị đối với các tác nhân vượt ra ngoài tương tác hiện tại. Ví dụ, các đại lý có thể biết rằng họ sẽ lại cạnh tranh với nhau trong tương lai

Dễ bị thông đồng

Đại lý có thể hưởng lợi bằng cách thông đồng. Ví dụ: 2 đại lý có thể tăng giá trị của họ cho một kết quả, điều này sẽ làm giảm khoản thanh toán của họ

VCG không tiết kiệm

Khoảng cách giữa chi phí thực của đại lý và khoản thanh toán mà họ có thể nhận được theo VCG là không giới hạn. Cuối cùng, VCG có thể tùy ý trả nhiều hơn số tiền mà một đại lý sẵn sàng chấp nhận [hoặc tính phí tương đương tùy ý thấp hơn số tiền mà một đại lý sẵn sàng trả]

Tính đơn điệu của doanh thu bị vi phạm

Doanh thu luôn tăng nhẹ khi có thêm đại lý. Một đại lý có thể giả làm 2 đại lý và loại bỏ khoản thanh toán của anh ta. [Tấn công Sybil]

Không thể trả lại tất cả doanh thu cho đại lý

Chúng tôi có thể muốn tìm cách nào đó trả lại lợi nhuận của cơ chế cho các đại lý. Tuy nhiên, khả năng nhận được khoản giảm giá sau khi cơ chế đã được chạy sẽ thay đổi các ưu đãi của đại lý

định lý

Cơ chế VCG là hợp lý cá nhân cũ khi lựa chọn thiết lập tính đơn điệu và không có thuộc tính ngoại ứng tiêu cực nào được giữ

Một môi trường thể hiện tính đơn điệu của tập lựa chọn nếu đối với tất cả các tác nhân, tập hợp các kết quả có thể đạt được khi không có tác nhân đó là một tập con yếu của tập hợp các kết quả có thể đạt được khi có tác nhân đó

Một môi trường không có ngoại ứng tiêu cực đối với tất cả các tác nhân và tất cả các lựa chọn có thể được thực hiện mà không có tác nhân đó, định giá của chính tác nhân cho mỗi lựa chọn này là không âm

định lý

Cơ chế VCG cân bằng ngân sách yếu khi thuộc tính hiệu ứng không có tác nhân duy nhất nắm giữ

Không có hiệu ứng tác nhân đơn lẻ - nếu tôi loại bỏ tác nhân i và sau đó tôi chọn một số lựa chọn khác thay thế mà không có tôi, thì những người khác ít nhất cũng hài lòng với lựa chọn mới cũng như với lựa chọn cũ

Định lý [Krishna & Perry, 1998]

Trong bất kỳ cài đặt trò chơi Bayesian nào mà VCG là hợp lý đơn lẻ trước đây, VCG thu được doanh thu ít nhất bằng với bất kỳ cơ chế hợp lý đơn lẻ tạm thời hiệu quả nào khác

Một hệ quả hữu ích. VCG cân bằng ngân sách như bất kỳ cơ chế hiệu quả nào có thể. nó đáp ứng cân bằng ngân sách yếu trong mọi trường hợp khi bất kỳ chiến lược chi phối, hiệu quả và cơ chế hợp lý riêng lẻ tạm thời nào cũng có thể

Chủ Đề