một giờ? Tuy nhiên, nó có thể nhanh chóng trở nên khá khó sử dụng. Riêng
việc tính toán mức trung bình cho bảy loại thông tin này đã tạo ra 128 tổ
hợp khác nhau. Thêm những loại thông tin khác vào sẽ tạo ra nhiều tổ hợp
hơn theo cấp số nhân.
Trước khi có máy tự học, sự hồi quy đa biến đã cung cấp một cách hiệu quả
để đánh giá điều kiện dựa vào nhiều yếu tố, mà không cần phải tính toán
hàng chục, hàng trăm hoặc hàng nghìn mức trung bình có điều kiện. Sự hồi
quy nhận dữ liệu và cố gắng tìm kiếm kết quả đồng thời hạn chế sai sót dự
đoán, tối đa hoá thứ được gọi là “sự phù hợp (của mô hình hồi quy)”.
Thật may rằng thuật ngữ này chính xác về mặt toán học hơn về về mặt
ngôn ngữ. Sự hồi quy giảm thiểu tối đa sai sót dự đoán ở mức trung bình và
sửa lại những sai sót lớn nhiều hơn sai sót nhỏ. Đó là một phương pháp
hiệu quả, đặc biệt là với những bộ dữ liệu khá nhỏ và ý thức tốt về những gì
sẽ có ích trong việc dự đoán. Với tỉ lệ churn trong truyền hình cáp, nó có
thể phản ánh độ thường xuyên xem TV của con người; nếu họ không sử
dụng dịch vụ truyền hình cáp, vậy họ có khả năng ngừng đăng ký.
Bên cạnh đó, các mô hình hồi quy mong muốn tạo ra những kết quả không
thiên vị, vậy nên với đủ những dự đoán, những dự đoán đó có thể sẽ chính
xác ở mức trung bình. Mặc dù chúng tôi thích những dự đoán không thiên
vị hơn là có thiên vị (ví dụ: tự động đánh giá cao hoặc đánh giá thấp một
giá trị), nhưng những dự đoán không thiên vị vẫn chưa thực sự hoàn hảo.
Việc dự đoán chính xác ở mức trung bình có thể gây ra sai sót. Sự hồi quy
có thể bị lỡ mất vài feet về phía bên trái hoặc vài feet về phía bên phải.
Ngay cả khi mức trung bình trùng với đáp án đúng, sự hồi quy có thể nghĩa
là không bao giờ thực sự bắn trúng mục tiêu. Không giống như sự hồi quy,
sự dự đoán của máy tự học có thể sai sót ở mức trung bình, nhưng khi sự
dự đoán sai, chúng thường không sai quá nhiều. Những nhà thống kê mô tả
điều này giống như là sự cho phép một số thiên vị để giảm phương sai.