khác.
59
Không cần bất kỳ lập trình cụ thể nào, riêng thuật toán đa
năng đã có thể giúp AlphaGo chơi thành công các tựa game bằng
cách thử nghiệm và sửa lỗi: nhấn các nút khác nhau một cách ngẫu
nhiên và sau đó điều chỉnh để tối đa hóa phần thưởng. Hết trò chơi
này đến trò khác, phần mềm này đã chứng minh tính linh hoạt trong
việc xác định chiến lược tiếp cận thích hợp và sau đó áp dụng
không sai sót.
Người ta có thể lập trình đa năng nhờ vào mạng neuron nhân tạo –
một mạng lưới các phần mềm và phần cứng bắt chước mạng
neuron trong bộ não con người.
60
Quá trình học tăng cường ở con
người diễn ra khi các phản hồi tích cực kích hoạt chất dẫn truyền
dopamine sản sinh như một tín hiệu thưởng cho bộ não. Nhờ đó,
chúng ta sẽ cảm thấy vui mừng và hãnh diện. Máy tính cũng có thể
được lập trình để hoạt động theo cách tương tự. Phần thưởng tích
cực sẽ xuất hiện dưới hình thức điểm số khi thuật toán đạt được kết
quả mong muốn. Với hệ thống hoạt động này, AlphaGo tự viết nên
các hướng dẫn ngẫu nhiên cho chính mình thông qua nhiều vòng
lặp thử nghiệm – mắc lỗi, sau đó thay thế các chiến lược thấp điểm
với những chiến lược ghi được điểm cao hơn.
Mẫu hình thiết kế này không hề mới bởi các nhà khoa học máy tính
đã thảo luận về học tăng cường từ hơn 20 năm rồi. Nhưng chỉ khi
sức mạnh máy tính phát triển thì việc học sâu (deep learning) mới đi
vào thực tiễn.
61
Điểm đáng chú ý ở AlphaGo chính là thuật toán của
nó liên tục cải thiện hiệu suất bằng cách chơi hàng triệu tựa game
với phiên bản đã được nâng cấp với chính nó.
62
Trong ván đấu thứ hai, ở phía bên phải của bàn cờ, AlphaGo đã
thực hiện một nước đi bất ngờ sau 37 lượt đi khiến cả Lee Sedol
cũng phải choáng váng. “Tôi chưa thấy người nào ra nước cờ này,”
Fan Hui (người từng ba lần vô địch giải cờ vây châu Âu) kêu lên khi
theo dõi trực tiếp cuộc chơi. Nhiều lần Fan phải thốt lên, “Thật
tuyệt.”
63
Một năm sau khi đánh bại Lee Sedol, AlphaGo tiếp tục tìm
đến bậc thầy cờ vua người Trung Quốc Ke Jie. “AlphaGo cải thiện
quá nhanh,” Ke phát biểu trong một họp báo và khen ngợi phong