Ngay khi đọc điều này, chúng ta đã nghĩ tại sao nó lại có thể như
vậy: Những người sở hữu xe hơi màu da cam có thể là những
người đam mê xe hơi và chăm sóc xe của họ tốt hơn? Có phải với
một màu đặc biệt nào đó, chiếc xe đã được sản xuất một cách
cẩn thận hơn, được tinh chỉnh trong cả các khía cạnh khác nữa?
Hoặc, có lẽ những chiếc xe màu cam là đáng chú ý hơn trên
đường và do đó ít có khả năng bị tai nạn, vì vậy chúng ở trong
tình trạng tốt hơn khi bán lại?
Chúng ta nhanh chóng bị vây hãm trong một lưới các giả thuyết
nhân quả cạnh tranh với nhau. Nhưng những nỗ lực của chúng
ta để làm sáng tỏ mọi việc theo cách này chỉ khiến cho chúng
mờ mịt thêm. Các mối tương quan có tồn tại, chúng ta có thể
biểu lộ chúng về mặt toán học. Nhưng chúng ta không thể dễ
dàng làm điều tương tự cho các liên kết nhân quả. Vì vậy, chúng
ta sẽ từ bỏ cố gắng giải thích lý do đằng sau các mối tương quan:
tại sao thay vì cái gì. Nếu không, chúng ta có thể sẽ tư vấn cho
những chủ sở hữu xe sơn những chiếc xe cũ của họ màu da cam
để giúp cho máy ít bị hỏng - một suy nghĩ rất vô lý.
Trong những năm gần đây, các nhà khoa học đã cố gắng giảm
chi phí thí nghiệm điều tra nhân quả, ví dụ bằng cách khéo léo
kết hợp thêm các cuộc điều tra chọn mẫu thích hợp để tạo ra
những cuộc “thử nghiệm giả”. Điều đó có thể giúp cho một số
cuộc điều tra nhân quả trở nên dễ dàng hơn, nhưng vẫn khó
lòng lấn át được lợi thế hiệu quả của các phương pháp phi-nhân-
quả. hơn nữa, dữ liệu lớn tự nó hỗ trợ việc điều tra nhân quả vì
nó hướng dẫn các chuyên gia hướng tới các nguyên nhân có
triển vọng để điều tra. Trong nhiều trường hợp, việc tìm kiếm
sâu hơn cho quan hệ nhân quả sẽ diễn ra sau khi dữ liệu lớn đã
thực hiện công việc của mình, khi chúng ta đặc biệt muốn điều
tra tại sao, chứ không chỉ đánh giá cao vấn đề cái gì.