đưa ra một con số chính xác. Nhưng việc biết rõ - rằng sự phân phối đó có
tính thang bậc và phân dạng - cũng đủ để cho chúng tôi vận hành và đưa ra
các quyết định.
Bài toán cận trên (Upper Bound)
Một số người đã nghiên cứu và chấp nhận mức phân dạng “đến một
điểm”. Họ tranh luận rằng tài sản, doanh số bán sách, và lợi nhuận thị
trường đều có một mức nhất định khi mọi thứ không còn phân dạng nữa.
“Sai số cụt” (truncation) là những gì họ đã đề xuất. Tôi đồng ý rằng có một
mức nơi tính phân dạng có thể sẽ dừng lại, nhưng là mức nào? Việc nói
rằng có một giới hạn trên nhưng tôi không biết nó cao đến mức nào, và việc
nói rằng không có giới hạn nào chứa các hậu quả giống nhau trên thực tế.
Việc đề xuất một giới hạn trên là hết sức không an toàn. Bạn có thể nói, hãy
phân tích mức tài sản cao nhất trị giá 150 tỷ đô-la. Sau đó, một người khác
cũng có thể nói, “Sao không phải là 151 tỷ đô-la”? Hay “Sao không phải là
152 tỷ đô-la”? Chúng ta cũng có thể xét đến trường hợp biến số đó là
không giới hạn.
Hãy cẩn thận về độ chính xác
Tôi đã học được một vài thủ thuật từ các trải nghiệm: bất kỳ số mũ nào
tôi cố đo cho được đều có thể bị đánh giá quá cao (hãy nhớ lại rằng một số
mũ cao sẽ có vai trò thấp đối với các độ lệch lớn) - những gì bạn nhìn thấy
có thể không mang yếu tố Thiên Nga Đen hơn những gì bạn không nhìn
thấy. Tôi gọi đây là bài toán ngụy trang (the masquerade problem).
Giả sử tôi tạo ra một quy trình có một số mũ là 1,7. Bạn không nhìn thấy
những thứ bên trong công cụ đó, chỉ thấy dữ liệu xuất hiện. Nếu tôi hỏi bạn
số mũ đó là gì, nhiều khả năng bạn sẽ tính toán được ra một con số đại loại
2,4. Bạn sẽ vẫn làm thế dù có cả triệu điểm dữ liệu. Nguyên nhân là do phải
mất một thời gian dài thì một số quy trình phân dạng mới bộc lộ các thuộc
tính của chúng, và bạn sẽ đánh giá thấp mức độ nghiêm trọng của cú sốc
đó.