Một giải pháp dường như đơn giản cho vấn đề thất bại hệ thống này là đa
dạng hóa máy dự đoán mà bạn khai thác. Điều này làm giảm rủi ro an ninh,
nhưng sẽ phải giảm hiệu suất. Nó có thể làm tăng nguy cơ của những thất
bại nhỏ ngẫu nhiên vì sự thiếu tiêu chuẩn hóa. Cũng như trong đa dạng sinh
học, sự đa dạng của máy dự đoán liên quan đến sự đánh đổi giữa kết quả ở
cấp độ cá nhân và hệ thống. Rất nhiều kịch bản cho việc thất bại hệ thống
bao gồm một cuộc tấn công hàng loạt vào các máy dự đoán. Ví dụ, một
cuộc tấn công vào tất cả các chiếc xe tự động đồng nghĩa với nguy cơ cho
sự an toàn quốc gia.
Một cách khác để chống lại sự tấn công hàng loạt quy mô lớn, là ràng buộc
thiết bị từ đám mây.
10
Chúng ta đã thảo luận về những lợi ích của việc bổ
sung sự dự đoán trên mặt đất thay vì trên đám mây với mục đích đẩy mạnh
việc học theo hoàn cảnh (với sự dự đoán chính xác hơn) và để bảo vệ sự
riêng tư của người tiêu dùng. Sự dự đoán trên mặt đất có một lợi ích khác.
Nếu thiết bị không kết nối với đám mây, một cuộc tấn công hàng loạt sẽ trở
nên khó khăn.
11
Mặc dù việc đào tạo máy dự đoán có thể xảy ra trên đám
mây hoặc ở đâu đó, một khi máy được đào tạo, nó có thể dự đoán trực tiếp
trên thiết bị mà không cần gửi thông tin trở về đám mây.
Rủi ro dữ liệu đào tạo
Một rủi ro khác là một ai đó có thể thẩm vấn máy dự đoán của bạn. Những
đối thủ cạnh tranh của bạn có thể đảo ngược kỹ thuật thuật toán của bạn,
hoặc ít nhất khiến máy dự đoán của họ sử dụng dữ liệu đầu ra từ thuật toán
của bạn như là dữ liệu đào tạo. Có lẽ ví dụ nổi tiếng nhất liên quan đến phát
hiện của nhóm chống spam từ Google. Máy dự đoán của Google được thiết
lập kết quả giả cho rất nhiều kết quả tìm kiếm kì dị mà không tồn tại như
“hiybbprqag”. Vài tuần sau, nhóm đã truy vấn công cụ tìm kiếm của Bing
của Microsoft. Không có gì ngạc nhiên, những kết quả tìm kiếm giả của
Google cho những tìm kiếm như ““hiybbprqag” xuất hiện trong kết quả của