Welcome to our forum
https://don9x.forumvi.com

Đăng kí tại đây để gia nhập cùng chúng tôi
=.=
Prisoners’ Dilemma – Hợp tác hay không Social_network
Welcome to our forum
https://don9x.forumvi.com

Đăng kí tại đây để gia nhập cùng chúng tôi
=.=
Prisoners’ Dilemma – Hợp tác hay không Social_network
Don 9X Forum (Don Style) Tham gia Don Group
Click Đăng Ký để tham gia cùng chúng tôi - Don 9X Forum





You are not connected. Please login or register

<b>Bài viết</b> Bài viết :
1516
:
<b>Vàng</b> Vàng :
386832
:
<b>Danh tiếng</b> Danh tiếng :
83
:
<b>Tham gia</b> Tham gia :
02/07/2012
:
Don Huy

admin

admin

http://don9x.com
“Ngụ ngôn hai người tù” là tên một trò chơi nghiên cứu về sự hợp tác giữa những người trong cuộc. Ý tưởng về trò chơi này được hai ông Merrill Flood và Melvin Dresher đưa ra thảo luận từ năm 1950, trong khuôn khổ nghiên cứu về lý thuyết trò chơi của Rand Corporation.

Cái tên “Ngụ ngôn hai người tù” (Prisoners’ Dilemma), dịch đúng là “tình trạng lưỡng nan của hai người tù”, được Albert Tucker đặt trong cuốn ghi chép không xuất bản của ông: “Two-person dilemma” năm 1950.

Truyện kể rằng Tanya và Cingque bị bắt khi mang súng vào Ngân hàng tiết kiệm Hibernia. Bị nhốt ở hai phòng giam riêng biệt, cả hai đều lo lắng cho số phận của mình hơn là cho đồng đảng. Nhân viên điều tra đã đưa ra một điều kiện thông minh nhằm lấy lời khai của hai tên cướp. Anh ta nói với mỗi tên trong bọn chúng: “Anh có quyền chọn Im lặng hoặc Khai báo nhưng hãy nhớ rằng nếu anh chịu Khai báo rằng các anh định cướp ngân hàng và đồng đảng của anh giữ Im lặng, anh sẽ được tự do và chúng tôi sẽ kết luận đồng đảng của anh phạm tội, hắn sẽ bị ngồi tù. Ngược lại, nếu anh giữ Im lặng mà đồng đảng của anh Khai báo, chính anh sẽ phải ngồi tù còn hắn sẽ ung dung tại ngoại. Nếu cả hai anh đều Khai báo, chúng tôi sẽ kết án với tình tiết giảm nhẹ, còn nếu cả hai đều giữ Im lặng, chúng tôi sẽ bỏ tù các anh vì tội mang súng trái phép.

Vậy anh chàng Tanya sẽ nghĩ sao nhỉ? Anh ta nghĩ đi nghĩ lại thì thấy mình chỉ có lựa chọn là Im lặng hoặc Khai báo mà thôi. (1) Nếu đồng đảng của Tanya Im lặng, Tanya cũng Im lặng, cả hai cùng bị tù vì mang súng bất hợp pháp. Nếu Tanya Khai báo, anh ta sẽ được tự do. Vậy thì Khai báo là hơn. (2) Nếu đồng đảng của Tanya Khai báo mà Tanya Im lặng, anh ta sẽ phải ngồi tù vì tội cướp ngân hàng. Nếu Tanya cũng Khai báo, anh ta sẽ được hưởng tình tiết giảm nhẹ. Vậy thì khai báo là hơn. Cingque cũng suy nghĩ như vậy. Và thế là cả hai đều chọn Khai báo và phải ngồi tù vì cướp nhà bằng, mặc dù có tình tiết giảm nhẹ thì cũng vẫn phải ngồi tù lâu hơn tội mang súng trái phép. Nếu trước đó, hai tên cướp có mối quan hệ tốt hơn hoặc chúng có thể trao đổi trước trong tù thì đâu đến nỗi.

Ở đó có thể thấy xung đột giữa lợi ích nhóm và lợi ích cá nhân. Một nhóm với những cá nhân trục lợi có thể dẫn tới kết quả tồi hơn nhóm khác. Trò chơi đặt ra vấn đề ở chỗ cả sẽ đều thắng nếu cùng hợp tác, nhưng nếu có một người không hợp tác, tức là phá vỡ cam kết, người đó sẽ được lợi nhiều hơn. Nếu cả hai đều phá vỡ cam kết, cả hai sẽ đều thua (hoặc được lợi chút ít).

Có thể biểu diễn tình huống và kết quả của trò chơi như sau:

A / B Hợp tác Không hợp tác
Hợp tác Khá có lợi +5 Rất có hại -10
Không hợp tác Rất có lợi +10 Bình thường 0

Đây là kết quả của A sau khi B đưa ra quyết định. Có thể thấy nếu B chọn Hợp tác, A chọn Không hợp tác sẽ có lợi hơn. Nếu B chọn Không hợp tác, A chọn Không hợp tác cũng có lợi hơn. B cũng sẽ chọn như vậy. Bất cứ ai hợp tác mà không được đáp lại sẽ bị thua thiệt bởi người kia, trừ khi họ tìm thấy lợi ích gia tăng, đôi bên cùng có lợi lớn (synergy), từ việc hợp tác.

Như vậy, prisoners’ dilemma là một trò chơi có tổng bằng 0 khi không tìm thấy sự hợp tác giữa những người chơi. Cả 2 đều nhận được 0 nếu đều không hợp tác, nếu một người nhận được +10 thì người kia sẽ nhận được -10 với tổng (+ 10 – 10) = 0. Rõ ràng là nếu trò chơi được chuyển sang tổng khác 0, hợp tác giữa hai người sẽ tạo ra cho mỗi người +5, với tổng (+ 5 + 5) = 10.

Vì lợi ích giữa việc cùng hợp tác (+5) nhỏ hơn việc không hợp tác (+10) nên người ta có xu hướng không hợp tác. Lập luận không phải hoàn toàn đúng. Chẳng hạn như ví dụ mà Pricipia Cybernetica đưa ra [1]: hai con sói luôn có thể bắt được con mồi lớn hơn nhiều con mồi mà một con sói có thể bắt được. Ngay cả khi một con sói bắt được một con thỏ và chia sẻ với bạn mình thì con sói lười nhác thứ hai cũng vẫn có ít thức ăn hơn nếu nó hợp tác với con sói thứ nhất để bắt một con hoẵng.

Tuy nhiên, việc hợp tác bắt một con hoãng không phải là đơn giản và người ta coi nó như một sự hợp tác lâu dài, đòi hỏi nhiều nỗ lực và công sức trong dài hạn. Prisoners’ Dilemma tập trung nghiên cứu về việc ra quyết định trong ngắn hạn, khi mà người tham gia không có thời gian hoặc không mong đợi vào sự hợp tác hay kết hợp trong tương lai (giống như trường hợp hai người tù). Vấn đề đặt ra là hai người ra quyết định đều suy nghĩ một cách thuần lý (rational) [2], tức là lựa chọn phương án có lợi nhất cho mình bất kể người kia muốn hợp tác hay không, vì vậy mà họ sẽ luôn chọn không hợp tác và dẫn tới chẳng ai được gì (0). Nếu họ không thuần lý mà chọn hợp tác thì cả hai đều có lợi (+5) mà không ai bị thua thiệt.

Serendip [3] có đưa ra một trò chơi với hai người A và B như sau:
- Mỗi lần đi, A và B phải chọn giữa hợp tác hoặc vượt lên người chơi cùng mình (bằng cách chọn cạnh tranh) mà không biết người kia sẽ chọn gì.
- Mỗi lần chơi, A và B mỗi người sẽ có một số tiền tuỳ thuộc vào lựa chọn của hai người.
- Nếu chọn hợp tác sẽ được 3 đồng.
- Nếu một người chọn hợp tác mà người kia chọn cạnh tranh, người đó sẽ được 5 đồng, còn người chọn hợp tác sẽ không được gì.
- Nếu cả hai cùng chọn cạnh tranh, mỗi người sẽ có 1 đồng.

Sau mỗi lượt chơi, người ta sẽ lấy ngẫu nhiên một số và so sánh với số tiền trung bình của những lần chơi trước đó của mỗi người. Đến hết lượt cuối cùng, các kết quả so sánh sẽ được công bố, nếu có lần nào đó số tiền trung bình nhỏ hơn số ngẫu nhiên, người chơi sẽ không được đồng nào cả. Nếu không, người chơi sẽ được hưởng tổng số tiền mà anh ta kiếm được đến hết lượt cuối cùng.

Như vậy, vì không thể biết được số ngẫu nhiên nên người chơi phải tìm cách tối đa số tiền anh ta thu được sau mỗi ván chơi. Theo như đã phân tích ở trên, A sẽ có xu hướng chọn cạnh tranh.

Lượt thứ nhất: Số tiền thu về của mỗi người thể hiện ở bảng dưới đây.
A / B Hợp tác Cạnh tranh
Hợp tác 3 / 3 0 / 5
Cạnh tranh 5 / 0 0 / 0
Giả sử A chọn cạnh tranh và B chọn hợp tác, A sẽ được 5 đồng, B thì không được đồng nào. Trung bình của A là 5, và của B là 0. Nếu B chọn cạnh tranh thì cả hai đều không có đồng nào.

Lượt thứ hai: Ở lượt đi này A sẽ chỉ có lợi khi B chọn hợp tác. Vậy B có chọn hợp tác hay không? Dưới đây là ma trận tổng số tiền của hai người nếu B chọn cạnh tranh (A đã có sẵn 5 đồng từ lượt chơi trước).
A / B Hợp tác Cạnh tranh
Hợp tác 8 / 3 0 / 5
Cạnh tranh 10 / 0 0 / 0

Rõ ràng B sẽ phải chọn cạnh tranh để tìm cách quân bình điểm với A, các lựa chọn khác đều dẫn tới B thấp điểm hơn A. Vậy khi B chọn cạnh tranh thì điểm của A dừng lại ở con số 5 cho dù A chọn phương án nào. Trung bình của A và B đều là: 2,5.

Bây giờ ta xét trường hợp A và B cùng chọn hợp tác ở lượt thứ nhất.
Lượt thứ nhất: Trung bình của cả hai người đều là 3.
Lượt thứ hai: Nếu cả cùng chọn hợp tác, trung bình sẽ vẫn là 3 > 2,5.
Cứ như vậy, nếu A hay B chọn cạnh tranh, tình huống sẽ rơi về trường hợp 1, làm cho trung bình sẽ lại nhỏ hơn trung bình khi chọn hợp tác (3). Do suy nghĩ thuần lý và không có trao đổi qua lại giữa hai bên, A và B đã tự làm tăng xác suất thua cuộc của mình lên trong khi cả hai có thể về đích an toàn và hưởng số tiền sau lượt chơi cuối cùng bằng cách hợp tác.

Robert Axerold, giáo sư chính trị và chính sách công của Đại học Michigan, tác giả cuốn “The Evolution of Cooperation”, đã tổ chức thực hiện 200 trò chơi Prisoners’ Dilemma từ đơn giản đến vô cùng phức tạp với 14 nhà kinh tế học và toán học nhằm tìm kiếm một chiến thuật tốt nhất cho mọi trò chơi. Kết quả là chiến thuật đơn giản nhất của giáo sư Anatol Rapoport của Đại học Toronto, Canada, đã đạt số điểm cao nhất. Chiến thuật đó được chiến thuật “ăn miếng trả miếng” (Tit For Tat) chỉ gồm 2 quy tắc:
- Lượt đầu tiên chọn hợp tác.
- Các lượt sau chọn như đối thủ đã chọn ở lượt liền kề trước đó.

Chiến thuật này càng khẳng định vị trí độc tôn sau khi Robert Axelrod tổ chức tiếp một vòng chơi khác gồm 62 đối thủ là các giáo sư đến từ 6 nước. Sức mạnh của Tit For Tat là khả năng ép các chiến thuật cạnh tranh phải hợp tác. Sau khi xếp hạng các chiến thuật theo điểm số từ cao xuống thấp, Axerold nhận thất rằng những người ít tha thứ (tức là ít quay lại hợp tác nhất) có điểm số thấp nhất. Ông đi tới kết luận bằng 4 quy tắc nổi tiếng.
- Không bao giờ là người đi quá giới hạn trước (luôn hợp tác ở những lượt chơi đầu tiên).
- Tự vệ nhưng biết tha thứ (không hợp tác nếu đối thủ không hợp tác, hợp tác nếu đối thủ hợp tác).
- Không đố kỵ cho dù người ta giàu có hơn mình (luôn duy trì hợp tác).
- Biết chắc là đối thủ có khả năng hiểu được trò chơi như mình.

Người ta nói rằng Martin Luther King Jr. và Assar Arafat, những nhà lãnh đạo được giải Nobel về hoà bình, đều đã áp dụng xuất sắc chiến thuật ấy. Thực hư thế nào xin được dành đến bài viết sau.

Xem chủ đề cũ hơn Xem chủ đề mới hơn Về Đầu Trang Thông điệp [Trang 1 trong tổng số 1 trang]

Permissions in this forum:
Bạn không có quyền trả lời bài viết

 
  • Create a forum on Forumotion | ©phpBB | Free forum support | Báo cáo lạm dụng | Thảo luận mới nhất