DỮ LIỆU LỚN - Trang 157

Chi phí phát sinh để thu thập nhiều dòng hoặc nhiều điểm dữ
liệu hơn trong mỗi dòng thường thấp. Vì vậy, rõ ràng là thu thập
càng nhiều dữ liệu càng tốt, cũng như cần làm cho dữ liệu có thể
được mở rộng bằng cách xem xét tiềm năng của các ứng dụng
phụ ngay từ đầu. Điều này làm tăng giá trị lựa chọn của dữ liệu.
Vấn đề là tìm các “ích lợi kép” - nghĩa là một bộ dữ liệu đơn nhất
có thể được sử dụng trong nhiều trường hợp nếu nó được thu
thập theo một cách nhất định. Nhờ đó, dữ liệu có thể thực thi
nhiều nhiệm vụ cùng lúc.

GIẢM GIÁ TRỊ CỦA DỮ LIỆU

Khi chi phí lưu trữ dữ liệu kỹ thuật số đã giảm mạnh, các doanh
nghiệp có động lực kinh tế mạnh mẽ trong việc giữ lại dữ liệu để
tái sử dụng cho cùng mục đích hoặc cho những mục đích tương
tự khác. Nhưng có một giới hạn cho tính hữu dụng của nó.

Ví dụ các công ty như NetAix và Amazon dựa vào các giao dịch
của khách hàng và các đánh giá để đưa ra khuyến nghị cho các
sản phẩm mới, do vậy họ có thể chấp nhận sử dụng các hồ sơ
nhiều lần cho nhiều năm. Với ý nghĩ đó, người ta có thể tranh
luận rằng khi không bị hạn chế bởi các giới hạn pháp lý như luật
bảo vệ quyền riêng tư, công ty nên sử dụng các hồ sơ kỹ thuật số
mãi mãi, hoặc ít nhất là khi vẫn còn hiệu quả về mặt kinh tế.
Tuy nhiên, thực tế lại không đơn giản như vậy.

Hầu hết dữ liệu đều bị mất một phần tính hữu ích của nó theo
thời gian. Trong những hoàn cảnh như vậy, việc tiếp tục dựa
vào dữ liệu cũ không chỉ thất bại trong việc gia tăng giá trị, nó
còn thực sự phá hủy giá trị của dữ liệu mới hơn. Hãy chọn một
cuốn sách bạn mua mười năm trước từ Amazon mà nó có thể
không còn phản ánh các sở thích của bạn nữa. Nếu Amazon sử

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.