Sự trừng phạt dựa trên dự đoán như vậy có vẻ là một bước cải
thiện so với những biện pháp mà chúng ta đã chấp nhận. Việc
ngăn chặn hành vi không lành mạnh, nguy hiểm, hoặc rủi ro là
một nền tảng của xã hội hiện đại. Chúng ta đã gây khó khăn cho
việc hút thuốc để ngăn ngừa bệnh ung thư phổi, chúng ta yêu
cầu thắt dây an toàn để ngăn ngừa tử vong trong tai nạn xe hơi,
chúng ta không cho phép hành khách lên máy bay với súng để
tránh cướp. Những biện pháp phòng ngừa như vậy hạn chế sự
tự do của chúng ta, nhưng nhiều người xem chúng như cái giá
nhỏ phải trả để tránh được tác hại nghiêm trọng hơn nhiều.
Trong nhiều trường hợp, phân tích dữ liệu đã được sử dụng
nhân danh việc phòng ngừa. Nó được sử dụng để gộp chúng ta
vào nhóm của những người giống chúng ta, và chúng ta thường
được đặc trưng hóa theo đó. Bảng tính toán bảo hiểm lưu ý rằng
những người đàn ông hơn 50 tuổi dễ bị ung thư tuyến tiền liệt,
vì vậy các thành viên của nhóm này có thể phải trả nhiều hơn
cho bảo hiểm y tế ngay cả khi họ không bao giờ mắc bệnh ung
thư tuyến tiền liệt. Nhóm học sinh trung học với điểm cao ít có
khả năng bị tai nạn xe hơi - vì vậy một số bạn học kém hơn của
họ phải đóng bảo hiểm cao hơn. Những cá nhân với một số đặc
điểm nào đó là đối tượng kiểm tra chặt chẽ hơn khi họ đi qua an
ninh sân bay.
Đó là ý tưởng đằng sau việc “lập hồ sơ” trong thế giới dữ-liệu-
nhỏ ngày nay. Tìm một liên hợp chung trong dữ liệu, xác định
một nhóm người để áp dụng vào, và sau đó đặt những người này
dưới sự giám sát bổ sung. Đó là một quy tắc khái quát áp dụng
cho tất cả mọi người trong nhóm. Tất nhiên phương pháp này
có nhược điểm nghiêm trọng. Nếu được sử dụng không đúng,
nó có thể dẫn tới không chỉ sự phân biệt đối xử với những nhóm
nhất định mà còn cả “phạm tội vì đồng lõa”.