Các nhà thống kê đã chỉ ra rằng độ chính xác chọn mẫu được cải
thiện rất đáng kể với sự ngẫu nhiên, chứ không phải với việc gia
tăng kích thước mẫu. Trên thực tế, mặc dù nó có vẻ lạ thường,
một mẫu được chọn ngẫu nhiên của 1.100 quan sát riêng lẻ trên
một câu hỏi nhị phân (có hay không, với khoảng tỷ lệ bằng
nhau) là đại diện đáng kể cho toàn dân. 19 trong 20 trường hợp,
nó nằm trong khoảng biên độ 3 phần trăm lỗi, bất kể quy mô
tổng dân số là một trăm ngàn hay một trăm triệu người. Lý do
của điều này lại rất phức tạp về mặt toán học, nhưng câu trả lời
ngắn gọn là sau một điểm nhất định, khi các con số ngày càng
lớn lên, thì số lượng biên của thông tin mới mà chúng ta thu
được từ mỗi quan sát sẽ ngày càng nhỏ đi. Thực tế, sự ngẫu
nhiên quan trọng hơn cỡ mẫu là một hiểu biết sâu sắc đáng
ngạc nhiên. Nó đã mở đường cho một cách tiếp cận mới để thu
thập thông tin.
Dữ liệu sử dụng các mẫu ngẫu nhiên có thể được thu thập với
chi phí thấp nhưng được ngoại suy với độ chính xác cao cho
tổng thể. Kết quả là các chính phủ có thể tiến hành các phiên
bản nhỏ của tổng điều tra sử dụng các mẫu ngẫu nhiên mỗi
năm, thay vì chỉ làm một tổng điều tra trong mỗi thập kỷ. Và họ
đã làm như vậy. Ví dụ Cục Điều tra Dân số Hoa Kỳ thực hiện hơn
200 cuộc điều tra kinh tế và dân số hàng năm dựa trên cơ sở lấy
mẫu, để bổ sung cho cuộc tổng điều tra dân số mười năm một
lần trong đó cố gắng đếm tất cả mọi người. Lấy mẫu là một giải
pháp cho vấn đề quá tải thông tin trước đây, khi việc thu thập và
phân tích dữ liệu rất khó thực hiện.
Các ứng dụng của phương pháp mới này nhanh chóng vượt ra
khỏi khu vực công và các cuộc tổng điều tra. Về bản chất, lấy
mẫu ngẫu nhiên làm giảm những vấn đề dữ liệu lớn xuống
thành những vấn đề dữ liệu dễ quản lý hơn. Trong kinh doanh,
nó được sử dụng để đảm bảo chất lượng sản xuất - làm cho các