Nếu cả hai có thể tin tưởng nhau, câu trả lời dĩ nhiên đơn giản: cùng ngậm
miệng và chỉ bị 1 năm tù. Nhưng liệu bạn có thể tin tưởng bạn mình? Liệu cảnh
sát có dọa cho anh ta phun ra hay không? Lỡ anh ta phản trong khi bạn im lặng
thì sao? Nó đồng nghĩa với việc anh ta thoát còn bạn lĩnh về 5 cuốn lịch. Nếu chỉ
chơi 1 ván, việc phản bạn có vẻ là một bước đi khôn ngoan, nhưng nếu chơi liên
tiếp 20 lượt thì sao? Chơi nhiều lần vậy có vẻ giống đời thực hơn chứ hả? Số
mệnh của chúng ta trên thực tế hiếm khi chỉ phụ thuộc vào bất kỳ một quyết định
đơn nhất nào.
Đây chính là điểm khởi đầu của Robert Axelrod. Khi Chiến tranh lạnh giữa
Mỹ và Liên Xô đang leo thang, ông muốn khám phá xem điều gì sẽ làm người ta
tin tưởng và hợp tác với nhau, và chiến thuật nào hiệu quả nhất. Thế là ông tổ
chức một cuộc đấu, trong đó các chương trình máy tính khác nhau với các chiến
lược khác nhau sẽ cùng tham gia trò Thế lưỡng nan của Tù nhân để tìm ra
chương trình đạt điểm số cao nhất.
Các nhà nghiên cứu từ khắp các lĩnh vực tâm lý, kinh tế, toán học, xã hội
học, và những lĩnh vực khác gửi đến tổng cộng 14 chương trình, cộng thêm 1
chương trình sẽ hoạt động theo kiểu hoàn toàn ngẫu nhiên. Có một chương trình
tốt đến điên rồ: Nó vẫn tin tưởng đối thủ của mình thậm chí sau khi bị chơi khăm.
Một chương trình khác tên ALL D thì hoàn toàn đối nghịch: Nó luôn phản bội
đối thủ dù không bị phản. Những chương trình khác thì nằm ở giữa hai cực này.
Vài chương trình phức tạp hơn thì tỏ ra tốt trong hầu hết thời gian nhưng thỉnh
thoảng lại lén phản bội. Có một chương trình tên Tester chuyên giám sát bước đi
của những chương trình khác để tính thử mình có thể "đánh lén" được bao nhiêu
và rồi sẽ "hoàn lương" nếu có đối thủ phát hiện là mình đang đâm sau lưng.
Vậy hệ thống đạo đức nào đã giành chiến thắng cuối cùng? Ngạc nhiên thay,
chương trình đơn giản nhất lại chiến thắng. Nó chỉ có 2 dòng code. Và nó khá
tương đồng với những gì chúng ta đã biết. Nó là chương trình TFT (tit for tat —
ăn miếng trả miếng).
Tất cả những gì TFT làm chỉ là hợp tác trong vòng đầu trò chơi, sau đó ở
mỗi vòng tiếp theo, nó sẽ chọn phương án mà đối thủ đã chọn trước đó. Ví dụ,
nếu trong vòng trước đối thủ chơi đẹp, nó sẽ chơi đẹp trong vòng tiếp theo; nếu
đối thủ chơi xấu, nó cũng sẽ làm tương tự.
Chương trình đơn giản này giành thắng lợi tuyệt đối. Thế rồi Axelrod lại tổ
chức một cuộc đấu khác. Lần này ông mời thêm nhiều chuyên gia hơn và có đến