DỮ LIỆU LỚN - Trang 53

chúng ta có thể sử dụng những cảm biến rẻ hơn, ít phức tạp hơn
(miễn là chúng không phát sinh một sai số có hệ thống). Rất có
thể là tại một số thời điểm, một vài cảm biến sẽ báo dữ liệu
không chính xác, tạo ra một bộ dữ liệu ít chính xác, hoặc “hỗn
độn” hơn so với bộ dữ liệu từ một cảm biến chính xác đơn nhất.
Bất kỳ phép đọc cụ thể nào đó cũng đều có thể không chính xác,
nhưng tổng hợp của nhiều phép đọc sẽ cung cấp một bức tranh
toàn diện hơn. Bởi vì bộ dữ liệu này bao gồm nhiều điểm dữ liệu
hơn, nó cung cấp giá trị lớn hơn nhiều và có thể bù đắp cho sự
hỗn độn của nó.

Bây giờ giả sử chúng ta tăng tần số các lần đọc cảm biến. Nếu đo
mỗi phút một lần, chúng ta có thể khá chắc chắn rằng trình tự
mà các dữ liệu đến sẽ hoàn toàn theo thứ tự thời gian. Nhưng
nếu chúng ta thay đổi, đọc đến mười hay một trăm lần trong
một giây, thì độ chính xác của trình tự có thể trở nên không
chắc chắn. Khi thông tin đi qua mạng, một bản ghi có thể bị trì
hoãn và đến lệch trình tự, hoặc đơn giản là có thể bị mất. Thông
tin sẽ ít chính xác đi một chút, nhưng khối lượng lớn sẽ khiến
cho khả năng từ bỏ sự chính xác nghiêm ngặt trở nên thích
đáng.

Trong ví dụ đầu tiên, chúng ta đã hy sinh tính chính xác của
mỗi điểm dữ liệu cho chiều rộng, và ngược lại chúng ta nhận
được tính chi tiết mà bình thường chúng ta có thể đã không
nhìn thấy. Trong trường hợp thứ hai, chúng ta đã từ bỏ sự chính
xác cho tần số, và ngược lại, chúng ta thấy sự thay đổi mà bình
thường chúng ta đã phải bỏ qua. Mặc dù có thể khắc phục
những sai sót nếu chúng ta đầu tư đủ nguồn lực vào đó - xét cho
cùng, mỗi giây có tới 30.000 giao dịch xảy ra trên Thị trường
Chứng khoán New York, nơi trình tự chính xác là vấn đề rất
quan trọng - trong nhiều trường hợp, việc chấp nhận lỗi thay vì
cố gắng ngăn chặn nó lại tỏ ra hiệu quả hơn.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.