người đó có nhịp tim bất thường hay không. Mỗi nhịp tim sau đó sẽ ít quan
trọng hơn những nhịp tim trước đó trong việc cải thiện sự dự đoán.
Hãy nghĩ đến thời gian mà bạn cần rời đi khi bạn định đến sân bay. Nếu
bạn chưa từng đến sân bay bao giờ, lần đầu tiên bạn đi sẽ đem lại nhiều
thông tin hữu ích. Lần thứ hai và lần thứ ba cũng sẽ cho bạn cảm nhận về
việc mất bao lâu. Tuy nhiên, cho đến lần thứ 100, có thể bạn sẽ không học
hỏi được nhiều nữa. Như vậy, dữ liệu đã giảm theo hiệu suất quy mô: khi
bạn càng có nhiều dữ liệu, mỗi thông tin thêm vào sau đó càng ít có giá trị
hơn.
Điều này có thể không đúng từ quan điểm kinh tế, vì nó không liên quan
đến việc dữ liệu có thể cải thiện sự dự đoán ra sao. Nó liên quan đến việc
dữ liệu có thể cải thiện giá trị bạn nhận được từ sự dự đoán. Đôi khi sự dự
đoán và kết quả đầu ra đi cùng nhau, nên sự giảm theo hiệu suất quy mô
trong quan sát thống kê ngụ ý đến kết quả đầu ra mà bạn quan tâm. Tuy
nhiên, mọi chuyện không phải lúc nào cũng vậy.
Người tiêu dùng có thể lựa chọn sản phẩm của bạn hoặc đối thủ của bạn.
Họ có thể chỉ sử dụng sản phẩm của bạn nếu như nó gần như luôn tốt bằng
hoặc hơn sản phẩm từ đối thủ của bạn. Trong nhiều trường hợp, tất cả đối
thủ cạnh tranh sẽ tốt ngang nhau trong những tình huống với những dữ liệu
có sẵn. Ví dụ, hầu hết các công cụ tìm kiếm cung cấp những kết quả tương
tự cho những tìm kiếm phổ biến. Cho dù bạn sử dụng Google hay Bing,
những kết quả từ tìm kiếm “Justin Bieber” đều tương tự nhau. Giá trị của
công cụ tìm kiếm được thúc đẩy bởi khả năng cung cấp kết quả tốt hơn cho
những tìm kiếm không phổ biến bằng. Hãy thử gõ từ “sự gián đoạn”
(disruption) vào Google và Bing. Vào thời điểm viết cuốn sách này, Google
cho ra cả hai định nghĩa trong từ điển và những kết quả liên quan đến ý
tưởng của Clay Christensen về siêu đổi mới. Chín kết quả đầu tiên của Bing
cho ra định nghĩa trong từ điển. Lý do chính khiến kết quả tìm kiếm của
Google tốt hơn là bởi để tìm ra điều mà người dùng cần trong kết quả tìm