DỮ LIỆU LỚN - Trang 214

của dữ liệu nhỏ. Chúng ta thử xem xét những trường hợp về tìm
kiếm web và xếp hạng phim dường như không xác định được.

Tháng 8 năm 2006, AOL công khai phát hành một tập hợp rất
lớn những truy vấn tìm kiếm cũ, với thiện chí là các nhà nghiên
cứu có thể phân tích nó để có được những hiểu biết thú vị. Bộ dữ
liệu gồm 20 triệu truy vấn tìm kiếm của 657.000 người sử dụng
từ ngày 1 tháng 3 tới 31 tháng 5 của năm đó. Thông tin cá nhân
như tên người sử dụng và địa chỉ IP đã được xóa và thay thế
bằng những số định danh duy nhất. Ý tưởng là các nhà nghiên
cứu có thể liên kết những truy vấn tìm kiếm của cùng một
người lại với nhau, nhưng không có thông tin nhận dạng.

Tuy nhiên, trong vòng vài ngày, tờ New York Times đã chắp nối
những lệnh tìm kiếm như “đàn ông độc thân 60” với “trà tốt cho
sức khỏe” và “những người làm vườn ở Lilburn, Ga” để xác định
thành công người mang số 4417749 là Thelma Arnold, một góa
phụ 62 tuổi ở Lilburn, Georgia. “Chúa ơi, đó là toàn bộ cuộc sống
cá nhân của tôi”, bà nói với phóng viên New York Times khi ông
đến gõ cửa. “Tôi không hề biết ai đó đã theo dõi mình”. Phản đối
của công chúng sau đó đã dẫn đến việc sa thải Giám đốc công
nghệ và hai nhân viên khác của AOL.

Tuy nhiên, chỉ hai tháng sau đó, vào tháng 10 năm 2006, dịch
vụ cho thuê phim Net ix đã làm điều tương tự với sự ra mắt
“giải thưởng Net ix” của họ. Công ty này đã phát hành 100
triệu hồ sơ thuê phim từ gần nửa triệu người sử dụng - và treo
tiền thưởng 1 triệu USD cho bất kỳ nhóm nào có thể cải thiện hệ
thống giới thiệu phim của Net ix để tăng ít nhất 10 phần trăm
hiệu quả. Một lần nữa, danh tính cá nhân vẫn được lấy ra khỏi
các dữ liệu. Và một lần nữa, có người vẫn bị chỉ đích danh: một
người mẹ, một phụ nữ đồng tính ở vùng Trung Tây bảo thủ của
Mỹ, sau đó đã kiện Net ix vì việc này dưới bí danh “Jane Doe”.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.