DỮ LIỆU LỚN - Trang 215

Các nhà nghiên cứu tại Đại học Texas ở Austin đã so sánh dữ liệu
Net ix với những thông tin công cộng khác. Họ nhanh chóng
phát hiện ra rằng những đánh giá bởi một người dùng ẩn danh
trùng hợp với những đánh giá của một cộng sự với trang web Cơ
sở Dữ liệu Phim Internet (IMDb). Tổng quát hơn, nghiên cứu đã
chứng minh rằng việc đánh giá chỉ 6 bộ phim không có tiếng
tăm (trong tốp 500) có thể giúp xác định một khách hàng của
Net ix tới 84 phần trăm. Và nếu biết được ngày mà người đó
đánh giá phim thì cô ta hoặc anh ta có thể bị chỉ đích danh trong
số gần nửa triệu khách hàng thuộc bộ dữ liệu, với độ chính xác
99 phần trăm.

Trong trường hợp AOL, danh tính của người sử dụng được bộc
lộ trong nội dung các lệnh tìm kiếm của họ. Trong trường hợp
Net ix, danh tính đã được tiết lộ bởi một so sánh các dữ liệu với
các nguồn khác. Trong cả hai trường hợp, các công ty đã thất bại
và không hề biết dữ liệu lớn đã hỗ trợ phi-vô-danh-hóa tốt như
thế nào. Có hai lý do: chúng ta thu thập nhiều dữ liệu hơn và
chúng ta kết hợp nhiều dữ liệu hơn. Paul Ohm, một giáo sư luật
tại Đại học Colorado ở Boulder và một chuyên gia về các tổn hại
do phi-vô-danh-hóa, giải thích rằng không hề có cách sửa chữa
dễ dàng nào cả. Với đủ dữ liệu, không thể ẩn danh tuyệt đối dù
cố gắng tới mức nào đi nữa. Tệ hơn, các nhà nghiên cứu gần đây
đã chỉ ra rằng không chỉ dữ liệu thông thường mà cả đồ thị xã
hội - những kết nối của mọi người với nhau - cũng dễ bị tổn
thương vì phi-vô-danh-hóa.

Trong thời đại của dữ liệu lớn, ba chiến lược cốt lõi từ lâu được
sử dụng để đảm bảo tính riêng tư - thông báo và xin phép cá
nhân, loại ra, và vô danh hóa - đã mất đi phần lớn hiệu quả của
chúng. Hiện nay nhiều người sử dụng đã cảm thấy sự riêng tư
của họ bị xâm phạm rồi, huống hồ đến lúc việc áp dụng dữ-liệu-
lớn trở nên phổ biến hơn.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.