có thể là một người thích mạo hiểm. Trong trường hợp đó, cỗ máy của công
ty sẽ ra sao?
Máy có thể học nhanh hơn với nhiều dữ liệu hơn và khi máy được sử dụng
trong thực tế, nó sẽ tạo ra nhiều dữ liệu hơn. Tuy nhiên, những điều tồi tệ
có thể xảy ra trong thế giới thực và làm tổn hại đến thương hiệu của công
ty. Đưa những sản phẩm vào thực tế sớm hơn có thể đẩy nhanh quá trình
học nhưng lại gây rủi ro tổn hại đến thương hiệu (và có lẽ là khách hàng);
đưa chúng ra muộn hơn sẽ làm giảm quá trình học nhưng có đủ thời gian để
cải thiện sản xuất và bảo vệ thương hiệu (và, một lần nữa, có lẽ là cả khách
hàng nữa).
Với một số sản phẩm, ví dụ như Google Inbox, câu trả lời cho sự đánh đổi
dường như rõ ràng vì chi phí của hiệu suất kém rất thấp và lợi nhuận từ
việc học hỏi từ khách hàng sử dụng là rất cao. Việc triển khai loại hình sản
phẩm này trong thế giới thực sớm hơn là hợp lý. Với những sản phẩm khác,
ví dụ như xe, câu trả lời mơ hồ hơn. Khi càng nhiều công ty khắp các
ngành công nghệ khác nhau cố gắng tìm cách tận dụng lợi thế của máy tự
học, những chiến lược liên quan đến việc xử lý sự đánh đổi sẽ trở nên nổi
bật hơn.
Học bằng cách mô phỏng
Một bước trung gian có thể làm giảm sự đánh đổi là sử dụng những môi
trường mô phỏng. Khi phi công tập luyện, trước khi họ lên máy bay thật,
họ dành hàng trăm giờ ở trong những môi trường mô phỏng tinh vi và thực
tế. Một cách tiếp cận tương tự cũng sẵn có cho AI. Google đào tạo AI
AlphaGO của DeepMind để đánh bại những người chơi Go giỏi nhất thế
giới không chỉ bằng cách quan sát hàng trăm trận đấu mà còn bằng việc đấu
với phiên bản khác của chính nó.
Một hình thức tiếp cận của phương pháp này được gọi là máy tự học đối
lập, AI chính được đặt mục tiêu chống lại một AI khác, cố gắng để đánh bại