Chương trình của Nowak và Sigmund – được gọi là PAVLOV theo tên
của nhà khoa học Nga nổi tiếng từng nghiên cứu về phản xạ có
điều kiện ở động vật – dùng chiến lược Thắng ở lại, thua thay đổi
để đưa ra mô hình hành vi con người về sự tha thứ và hy vọng.
Chương trình này tiếp tục hợp tác miễn là chương trình khác còn
hợp tác, nhưng, khác với TIT FOR TAT, nó vẫn sẽ mời gọi hợp tác
nếu cả hai chương trình đều thất bại vì cả hai đều gian lận trong
lần đối đầu trước, với hy vọng chương trình kia được thiết kế để
tiếp tục hợp tác nếu có lời mời hợp tác. Nói theo cách chuyên môn
như Nowak và Sigmund thì nó “thể hiện một sự phản ứng gần giống
với phản xạ đối với phần thưởng: nó lặp lại bước đi cũ nếu… được
thưởng, nhưng chuyển đổi hành vi nếu… bị phạt”.
Đó chính là điều mà anh bạn cùng mua sách giảm giá với tôi đã
làm sau khi tôi phát hiện ra anh ta đã gian lận trong quá trình hợp tác
giữa chúng tôi. Bằng cách phản ứng với sự hợp tác mới một cách vô
thức, anh ta đã sử dụng chiến lược PAVLOV. Những người khai sinh
ra chiến lược này diễn giải sự thành công của nó như sau:
Thành công của chiến lược Tit for Tat (TFT) một phần nằm ở
hệ thống máy tính. Trong tự nhiên, các sai sót [và những nhiễu
loạn ngẫu nhiên] thường xảy ra… [và] những sai lầm giữa hai
người tham gia vào TFT sẽ dẫn tới tình trạng cả hai bên cùng
chơi xấu nhau. (Những sai lầm như vậy có rất nhiều trong
cuộc sống; ngay cả con người cũng thường có xu hướng trút
giận vào những người ngoài cuộc vô tội)…
PAVLOV có hai lợi thế quan trọng so với TFT: (1) Sai lầm
không cố ý giữa hai người tham gia vào chiến lược PAVLOV…
dẫn tới việc cả hai bên cùng quay lưng lại với nhau rồi sau đó
lại trở về trạng thái hợp tác chung [và] (2)… Trong chiến lược
PAVLOV, người ta sẵn sàng lợi dụng kẻ khờ khạo…