đặc biệt rõ ràng về các tiểu phần: tiểu thể loại và tiểu thị trường
mà mẫu không thể ước định được.
Việc xem xét dữ liệu rộng lớn hơn cũng cho phép chúng ta nới
lỏng mong muốn hướng tới tính chính xác, là sự thay đổi thứ
hai, được đề cập tới trong Chương Ba. Đó là một sự đánh đổi: với
ít lỗi hơn từ chọn mẫu, chúng ta có thể chấp nhận nhiều lỗi đo
lường hơn. Khi khả năng để đo lường là có hạn, chúng ta chỉ
tính đến những thứ quan trọng nhất. Sự cố gắng để có được con
số chính xác là hợp lý.
Ta không thể bán được gia súc nếu người mua không biết chắc
liệu có 100 hay chỉ có 80 con trong đàn. Cho đến gần đây, tất cả
các công cụ kỹ thuật số của chúng ta có tiền đề là sự chính xác:
chúng ta giả định rằng công cụ cơ sở dữ liệu sẽ truy tìm được các
bản ghi hoàn toàn phù hợp với câu hỏi của chúng ta, giống như
các bảng tính điện tử lập biểu các con số trong một cột.
Loại tư duy này là một chức năng của môi trường “dữ liệu nhỏ”:
với rất ít thứ để đo lường, chúng ta phải xem xét những gì quan
tâm để định lượng một cách càng chính xác càng tốt.
Theo một số cách nào đó thì việc này là hiển nhiên: một cửa
hàng nhỏ có thể đếm tiền trong quỹ cuối ngày tới tận đồng xu,
nhưng chúng ta sẽ không - thực sự là không thể - làm tương tự
cho tổng sản phẩm nội địa của một quốc gia. Khi quy mô tăng,
số lượng của những sự không chính xác cũng tăng.
Tính chính xác đòi hỏi dữ liệu được giám tuyển một cách cẩn
thận. Điều này có thể làm được cho những số lượng nhỏ, và tất
nhiên một số trường hợp vẫn đòi hỏi như vậy: ta hoặc có hoặc
không có đủ tiền trong ngân hàng để viết một chi phiếu. Nhưng
đổi lại, khi sử dụng những bộ dữ liệu toàn diện hơn nhiều,