học Ian Hacking, trong cuốn sách The Taming of Chance (tạm dịch: Làm
chủ cơ hội), nói rằng, trước thế kỷ 19, xác suất chính là lãnh thổ của những
người đánh cược.
4
Cho đến thế kỷ 19, dữ liệu điều tra dân số đã tăng lên
nhờ sử dụng kỹ thuật toán học mới xuất hiện là xác suất vào khoa học xã
hội. Thế kỷ 20 chứng kiến sự sắp xếp lại hiểu biết mang tính quan trọng
của chúng ta về thế giới vật chất, chuyển từ Thuyết quyết định của Newton
(tất cả các sự việc xảy ra là do những điều tất yếu và do đó không thể tránh
được) sang Nguyên lý bất định của cơ học lượng từ. tiến bộ quan trọng nhất
trong khoa học máy tính của thế kỷ 21 phù hợp với những tiến bộ về khoa
học xã hội và vật chất sau: sự công nhận rằng thuật toán hoạt động tốt nhất
khi xác suất được cấu trúc dựa trên dữ liệu.
NHỮNG ĐIỂM CHÍNH
• Khoa học về máy tự học có những mục tiêu khác so với thống kê số liệu.
Trong khi thống kê số liệu nhấn mạnh vào việc chính xác ở mức trung bình,
máy tự học không cần điều đó. Thay vào đó, mục tiêu của máy tự học là
hoạt động hiệu quả. Sự dự đoán vẫn sẽ được ưu tiên miễn là chúng tốt hơn
(điều trở nên khả thi nhờ sức mạnh của máy tính). Điều này đem lại cho
những nhà khoa học sự tự do để thực nghiệm và thúc đẩy sự cải thiện
nhanh chóng bằng cách tận dụng lợi thế của dữ liệu phong phú và sự xuất
hiện của máy tính nhanh trong hơn một thập kỷ qua.
• Những phương pháp thống kê số liệu truyền thống yêu cầu sự chính xác
của giả thuyết hoặc ít nhất là trực giác của con người đối với mô hình cụ
thể. Máy tự học có ít nhu cầu xác định cái gì sẽ đi vào mô hình và có thể
chứa lượng tương đương những mô hình phức tạp hơn với những tương tác
giữa các biến.
• Những tiến bộ gần đây trong máy tự học thường được gọi là những tiến
bộ trong trí tuệ nhân tạo vì: (1) những hệ thống dự đoán dựa trên kỹ thuật
này học hỏi và cải thiện theo thời gian; (2) những hệ thống này tạo ra
những dự đoán quan trọng chính xác hơn những cách tiếp cận khác dưới