DỮ LIỆU LỚN - Trang 35

người, ông đã nghĩ ra một cách tiếp cận - mà ngày nay chúng ta
gọi là “thống kê” - cho phép ông suy ra quy mô dân số. Cách tiếp
cận của ông là thô, nhưng nó thiết lập ý tưởng rằng người ta có
thể ngoại suy từ một mẫu nhỏ những hiểu biết hữu ích về dân
số tổng quát. Nhưng cách người ta làm thế nào mới quan trọng.
Graunt thì chỉ nhân rộng ra từ mẫu của mình.

Hệ thống của ông đã nổi tiếng, mặc dù sau đó chúng ta biết
những con số của ông là hợp lý nhờ may mắn. Trải qua nhiều
thế hệ, việc chọn mẫu vẫn sai sót rất lớn. Do đó với các cuộc điều
tra dân số và những công việc dạng “dữ liệu lớn” tương tự, cách
tiếp cận để cố gắng đếm tất cả vẫn là phổ biến.

Bởi các cuộc điều tra dân số rất phức tạp, tốn chi phí và tốn thời
gian, nên chúng ít được thực hiện. Người La Mã cổ đại, vẫn tự
hào với một dân số mấy trăm ngàn, thực hiện điều tra dân số
năm năm một lần. Hiến pháp Hoa Kỳ bắt buộc một cuộc điều tra
dân số trong mỗi thập kỷ, khi đất nước đang phát triển này có
tới hàng triệu người. Nhưng vào cuối thế kỷ XIX, thậm chí việc
này cũng trở nên khó khăn. Dữ liệu đã vượt quá khả năng xử lý
của Cục Điều tra Dân số.

Điều gây sốc là cuộc điều tra dân số năm 1880 đã mất tám năm
để hoàn thành. Thông tin đã trở thành lỗi thời ngay cả trước khi
nó được công bố. Tệ hơn nữa, các quan chức ước tính việc điều
tra dân số năm 1890 sẽ cần tới 13 năm để lập bảng - một tình
trạng hết sức vô lý, chưa nói đến chuyện vi phạm Hiến pháp.
Tuy nhiên, do việc phân chia các loại thuế và đại diện trong
Quốc hội dựa trên dân số, nên việc có được không chỉ một con
số chính xác mà còn phải kịp thời là rất cần thiết.

Vấn đề Cục Điều tra Dân số Hoa Kỳ phải đối mặt cũng tương tự
với sự khó khăn của các nhà khoa học và doanh nhân vào đầu
thiên niên kỷ mới, khi vấn đề trở nên rõ ràng là họ đã chết đuối

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.