Đôi khi những khó khăn mà chúng ta đang sống cùng thực ra
chỉ là những chức năng của quy mô mà chúng ta hoạt động
trong đó, và điều này cũng tương tự cho tất cả mọi thứ. Hãy xét
một sự tương tự thứ ba, lại cũng từ các ngành khoa học. Đối với
con người, định luật vật lý quan trọng nhất là lực hấp dẫn: nó
ngự trị trên tất cả những gì chúng ta làm. Nhưng đối với những
côn trùng nhỏ xíu, trọng lực hầu như vô nghĩa. Đối với một số
loài như nhện nước, định luật vật lý có tác động với chúng
chính là sức căng bề mặt, cho phép chúng đi qua một cái ao mà
không chìm xuống.
Với thông tin, cũng như với vật lý, kích thước là quan trọng. Do
đó, Google có thể xác định được sự lây lan của bệnh cúm chính
xác như các dữ liệu chính thức dựa trên việc bệnh nhân thực sự
tới gặp bác sĩ. Google có thể làm điều này bằng cách kết hợp
hàng trăm tỷ từ khóa tìm kiếm - và nó có thể đưa ra một câu trả
lời gần như trong thời gian thực, nhanh hơn nhiều các nguồn
chính thức. Tương tự như vậy, Farecast của Etzioni có thể dự
đoán sự biến động giá của một chiếc vé máy bay và do đó
chuyển quyền lực kinh tế đáng kể vào tay người tiêu dùng.
Nhưng cả hai chỉ có thể làm tốt như vậy bằng cách phân tích
hàng trăm tỷ điểm dữ liệu.
Hai ví dụ trên cho thấy tầm quan trọng về khoa học và xã hội
của dữ liệu lớn cũng như mức độ mà dữ liệu lớn có thể trở thành
một nguồn giá trị kinh tế. Chúng đánh dấu hai cách thức mà thế
giới dữ liệu lớn đã sẵn sàng để cải tổ tất cả mọi thứ, từ các doanh
nghiệp và các ngành khoa học tới chăm sóc sức khỏe, chính
phủ, giáo dục, kinh tế, nhân văn, và mọi khía cạnh khác của xã
hội.
Mặc dù mới chỉ đang ở buổi bình minh của dữ liệu lớn, chúng ta
dựa vào nó hàng ngày. Bộ lọc thu rác được thiết kế để tự động