dụng để đưa ra những quyết định kinh tế. Nó xử lý hàng triệu
sản phẩm bán ra của hàng trăm nhà bán lẻ trong hơn 70 quốc
gia mỗi ngày. Tất nhiên, các con số đòi hỏi phải có sự giải thích
cẩn thận, nhưng chúng tốt hơn so với số liệu thống kê chính
thức trong việc chỉ ra xu hướng lạm phát. Bởi vì có nhiều giá và
các con số có sẵn trong thời gian thực, chúng cung cấp cho
người ra quyết định một lợi thế đáng kể. (Phương pháp này cũng
đóng vai trò như một cách kiểm tra bên ngoài đáng tin cậy đối
với các cơ quan thống kê quốc gia. Ví dụ, The Economist nghi ngờ
phương pháp tính lạm phát của Argentina, vì vậy đã dùng các số
liệu của PriceStats để thay thế.)
Áp dụng sự hỗn độn
Trong nhiều lĩnh vực công nghệ và xã hội, chúng ta đang
nghiêng về ủng hộ sự nhiều hơn và sự hỗn độn chứ không phải
sự ít hơn và sự chính xác. Hãy xem xét trường hợp của việc
phân loại nội dung. Trong nhiều thế kỷ con người đã phát triển
các nguyên tắc phân loại và chỉ số để lưu trữ và tìm kiếm tài
liệu. Những hệ thống phân cấp này đã luôn luôn không hoàn
hảo, như những ai từng quen thuộc với danh mục thẻ thư viện
đều có thể đau đớn nhớ lại. Trong một thế giới dữ-liệu-nhỏ thì
chúng hoạt động đủ tốt. Tuy nhiên khi tăng quy mô lên nhiều
cấp độ, những hệ thống này, được cho là sắp xếp vị trí mọi thứ
bên trong rất hoàn hảo, lại sụp đổ. Ví dụ, trong năm 2011 trang
web chia sẻ hình ảnh Flickr có chứa hơn 6 tỷ hình ảnh từ hơn 75
triệu người sử dụng. Việc cố gắng gán nhãn cho từng bức ảnh
theo những thể loại định trước đã tỏ ra vô ích. Liệu đã thực sự có
một thể loại mang tên “Mèo trông giống như Hitler”?
Thay vào đó, nguyên tắc phân loại sạch được thay thế bằng cơ
chế hỗn độn hơn nhưng linh hoạt hơn và dễ thích nghi hơn một