xuất bản cuốn hồi ký In Retrospect chỉ trích lối tư duy và những
quyết định của chính mình trong vai trò Bộ trưởng Quốc phòng.
“Chúng tôi đã sai, quá sai”, ông viết. Nhưng đó là ông đề cập đến
chiến lược rộng của chiến tranh. Về vấn đề dữ liệu, và đặc biệt là
những con số thương vong, McNamara vẫn không ăn năn. Ông
ta thừa nhận nhiều số liệu thống kê đã “lừa dối hoặc sai sót”.
“Nhưng những gì có thể đếm, bạn cần phải đếm. Thiệt hại về
người là một trong số đó”. McNamara qua đời năm 2009 ở tuổi
93 - một người thông minh nhưng không khôn ngoan.
Dữ liệu lớn có thể lôi kéo chúng ta phạm tội lỗi của McNamara:
trở nên quá gắn chặt với dữ liệu, và bị ám ảnh bởi sức mạnh và
triển vọng của nó tới mức chúng ta không đánh giá đúng các
hạn chế của nó. Thử nhìn lại Xu hướng Dịch cúm của Google.
Hãy xem xét một tình huống, không hoàn toàn viển vông, trong
đó một chủng nguy hiểm chết người của bệnh cúm dữ dội lan
khắp toàn quốc. Các chuyên gia y khoa sẽ biết ơn khả năng dự
báo trong thời gian thực các điểm nóng nhất bằng cách rà soát
các truy vấn tìm kiếm. Họ sẽ biết được nơi nào phải can thiệp để
giúp đỡ.
Nhưng giả sử rằng trong một thời điểm của cuộc khủng hoảng,
các nhà lãnh đạo chính trị cho rằng chỉ biết nơi nào căn bệnh
này có thể trở nên tồi tệ hơn và cố gắng loại trừ nó đi là không
đủ. Vì vậy, họ yêu cầu một cuộc cách ly trên diện rộng - không
phải với tất cả mọi người trong những vùng này, vì không cần
thiết và quá rộng. Dữ liệu lớn cho phép chúng ta tập trung hơn.
Thế nên việc cách ly chỉ áp dụng với những cá nhân thực hiện
các lệnh tìm kiếm nào cho thấy họ nhiều khả năng nhiễm bệnh
nhất. Ở đây chúng ta có dữ liệu về họ để lọc ra. Các đặc vụ của
liên bang, nắm trong tay danh sách các địa chỉ IP và thông tin
GPS của điện thoại di động, sẽ gom những người này vào các
trung tâm cách ly.