THIÊN NGA ĐEN - Trang 366

mọi người quên rằng ông bắt đầu với kinh tế học trước khi chuyển sang vật
lý và hình học tự nhiên. Làm việc với nguồn dữ liệu dồi dào như thế khiến
chúng ta thấy mình trở nên xoàng xĩnh; nó mang đến khả năng hiểu biết
bằng trực giác về sai sót sau: đi sai hướng trên con đường giữa mô tả và
thực tế.

Bài toán về một phân môn nhỏ của thống kê học có liên quan đến dữ liệu

mang tính chu kỳ - circular statistics - (mà chúng ta cũng có thể gọi là luận
cứ/đối số hồi quy thống kê - statistical regress argument) như sau. Ví dụ,
bạn cần các dữ liệu quá khứ để biết một phân phối xác suất là thuộc đường
cong Gauss, phân dạng hay một thứ gì khác. Bạn cần phải biết mình có đủ
dữ liệu để hỗ trợ cho tuyên bố của mình hay không. Làm thế nào biết được
chúng ta có đủ dữ liệu hay không? Từ sự phân phối xác suất đó - một phân
phối sẽ nói cho bạn biết là có đủ dữ liệu để “tạo sự tự tin” về những gì bạn
sắp suy luận. Nếu đó là đường cong hình chuông Gauss thì chỉ cần một vài
điểm là đủ (một lần nữa luật số lớn). Và làm thế nào biết được sự phân phối
đó là đường cong Gauss? Chính là từ dữ liệu. Vì thế, chúng ta cần có dữ
liệu để biết phân phối xác suất đó là gì, và một phân phối xác suất sẽ cho
chúng ta biết mình cần bao nhiều dữ liệu. Điều này gây ra một đối số hồi
quy khốc liệt.

Sự hồi quy này sẽ không xảy ra nếu bạn giả định trước rằng sự phân phối

đó thuộc đường cong Gauss. Vì một lý do nào đó, có thể đường cong Gauss
sẽ tạo ra các thuộc tính của nó một cách dễ dàng. Điều này không xảy ra
với các phân phối thuộc Extremistan. Vì thế, việc chọn đường cong Gauss
trong khi dẫn chứng bằng một quy luật chung nào đó có vẻ như sẽ diễn ra
thuận lợi. Đường cong Gauss được dùng như một phân phối mặc định vì
chính nguyên nhân đó. Như tôi đã nhắc đi nhắc lại, việc giả định trước
được ứng dụng của đường cong này có thể có tác dụng với một số lĩnh vực
nhỏ như thống kê về tội phạm, tỷ lệ tử vong, những vấn đề thuộc
Mediocristan, nhưng không dành cho các dữ liệu lịch sử về những đặc tính
ẩn và những vấn đề thuộc Extremistan.

Vậy sao các nhà thống kê làm việc với các dữ liệu lịch sử lại không nhận

biết về vấn đề này? Thứ nhất, họ không muốn nghe rằng toàn bộ công việc

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.