DỮ LIỆU LỚN - Trang 50

3. HỖN ĐỘN

NGÀY CÀNG CÓ NHIỀU BỐI CẢNH, trong đó việc sử dụng tất cả
các dữ liệu có sẵn là khả thi. Tuy nhiên nó đi kèm với chi phí.
Tăng khối lượng sẽ mở cánh cửa cho sự thiếu chính xác. Điều
chắc chắn là những số liệu sai sót và bị hỏng đã luôn luôn len lỏi
vào các bộ dữ liệu. Chúng ta đã luôn luôn xem chúng như những
rắc rối và cố gắng loại bỏ chúng, một phần vì chúng ta có thể
làm được như vậy. Những gì chúng ta chưa bao giờ muốn làm là
xem chúng như điều không thể tránh khỏi và học cách sống
chung với chúng. Đây là một trong những thay đổi cơ bản khi
chuyển từ dữ liệu nhỏ sang dữ liệu lớn.

Trong thế giới của dữ liệu nhỏ, giảm sai sót và đảm bảo chất
lượng cao của dữ liệu là một động lực tự nhiên và cần thiết. Vì
chỉ thu thập được một ít thông tin, chúng ta phải bảo đảm rằng
những con số đã được cố gắng ghi lại là chính xác nhất có thể.
Nhiều thế hệ các nhà khoa học đã tối ưu hóa các công cụ để các
phép đo đạc của họ ngày càng chính xác hơn, dù là để xác định
vị trí của các thiên thể hay kích thước của các đối tượng dưới
kính hiển vi. Trong thế giới lấy mẫu, nỗi ám ảnh với sự chính
xác thậm chí còn nặng nề hơn. Việc phân tích chỉ một số lượng
hạn chế các điểm dữ liệu có nghĩa là lỗi có thể được khuếch đại,
có khả năng làm giảm tính chính xác của kết quả tổng thể.

Trong phần lớn lịch sử, những thành quả cao nhất của loài
người xuất hiện từ việc chinh phục thế giới bằng cách đo lường
nó. Việc tìm kiếm sự chính xác bắt đầu tại châu Âu vào giữa thế
kỷ thứ mười ba, khi các nhà thiên văn học và các học giả đã
gánh vác việc định lượng thời gian và không gian một cách

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.