DỮ LIỆU LỚN - Trang 262

khai thác dữ liệu ở quy mô rộng lớn hơn rất nhiều, và trong một
số trường hợp có thể đến gần được với tất cả dữ liệu. Nhưng làm
như vậy khiến chúng ta phải hoạt động theo những cách phi
truyền thống, và đặc biệt nó sẽ thay đổi suy nghĩ của chúng ta
về những gì cấu thành thông tin hữu ích.

Thay vì bị ám ảnh về tính chính xác, tính đúng đắn, sạch sẽ, và
tính chắc chắn của dữ liệu, chúng ta có thể để cho một số hạt
sạn xen vào. Chúng ta không nên chấp nhận một tập hợp dữ liệu
hoàn toàn sai hoặc đúng, nhưng có thể chấp nhận sự hỗn độn để
đổi lại việc thu về một tập dữ liệu toàn diện hơn rất nhiều. Thật
ra, trong một số trường hợp sự to lớn và hỗn độn thậm chí có
thể có lợi, bởi vì khi cố gắng sử dụng chỉ một phần nhỏ và chính
xác của dữ liệu, chúng ta cuối cùng đã thất bại trong việc nắm
bắt được chiều rộng của chi tiết nơi có chứa rất nhiều kiến thức.

Vì các mối tương quan có thể được tìm thấy nhanh hơn và rẻ
hơn so với quan hệ nhân quả, chúng thường thích hợp hơn.
Chúng ta sẽ vẫn cần các nghiên cứu nhân quả và các thí nghiệm
có kiểm soát với các dữ liệu được giám tuyển cẩn thận trong
một số trường hợp, chẳng hạn như thiết kế một chi tiết máy bay
quan trọng. Nhưng đối với nhiều nhu cầu hàng ngày, việc biết
cái gì chứ không phải tại sao là đủ tốt rồi. Và các mối tương quan
dữ-liệu-lớn có thể chỉ ra con đường hướng tới các lĩnh vực đầy
triển vọng, mà trong đó con người có thể khám phá những mối
quan hệ nhân quả.

Các mối tương quan nhanh chóng này cho phép chúng ta tiết
kiệm tiền vé máy bay, dự báo dịch cúm, và biết được hố ga hoặc
các tòa nhà quá đông đúc nào cần phải kiểm tra trong một thế
giới khá hạn hẹp về nguồn lực. Chúng có thể giúp các công ty
bảo hiểm y tế cung cấp dịch vụ bảo hiểm mà không cần một kỳ
khám sức khỏe, và giảm chi phí nhắc nhở người bệnh dùng

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.