Vượt xa hơn tỉ lệ churn
Máy tự học đang cải thiện sự dự đoán trong vô số những bối cảnh khác
ngoài tỉ lệ churn, từ thị trường tài chính đến thời tiết.
Cuộc khủng hoảng tài chính vào năm 2008 là một thất bại đáng kinh ngạc
của những phương pháp dự đoán dựa trên sự hồi quy. Một yếu tố thúc đẩy
khủng hoảng tài chính là những dự đoán về khả năng mặc định của những
nghĩa vụ nợ thế chấp, hay được gọi là CDO. Vào năm 2007, những công ty
xếp hạng như Standard & Poor’s dự đoán rằng những CDO hạng AAA có ít
hơn 1/800 cơ hội bị thất bại trong việc không đạt được lợi nhuận trong
vòng năm năm. Năm năm sau, hơn một trong bốn CDO thất bại trong việc
đạt được lợi nhuận. Dự đoán ban đầu hoàn toàn sai cho dù đã có rất nhiều
dữ liệu mặc định trước đây.
Sự thất bại không phải do thiếu dữ liệu, mà thay vào đó là cách những
chuyên gia phân tích sử dụng dữ liệu để dự đoán. Những công ty xếp hạng
dự đoán dựa trên những mô hình hồi quy giả định rằng giá nhà trong những
thị trường khác nhau thì thường không liên quan đến nhau. Điều đó hoá ra
là sai, không chỉ vào năm 2007 và cả trước đó cũng vậy. Bao gồm cả khả
năng một cú sốc có thể gây ảnh hưởng nhiều thị trường nhà cùng một lúc
và khả năng này gia tăng khi bạn mất CDO, ngay cả khi chúng được phân
phối khắp nhiều thành phố của Hoa Kỳ.
Những chuyên gia phân tích xây dựng mô hình hồi quy của họ trên những
giả thuyết về những điều họ tin là quan trọng và niềm tin là không cần thiết
với máy tự học. Những mô hình máy tự học đặc biệt tốt trong việc xác định
những biến nào có thể hoạt động tốt nhất và nhận ra một vài điều không
quan trọng trong khi đó những điều khác lại quan trọng một cách đáng ngạc
nhiên. Hiện giờ, trực giác và giả thuyết của chuyên gia phân tích trở nên ít
quan trọng hơn. Bằng cách này, máy tự học dự đoán dựa trên những mối
liên quan có thể không được dự đoán trước, bao gồm giá nhà ở Las Vegas,
Phoenix và Miami có thể thay đổi cùng một lúc.