ra của tình huống đó. Nếu bạn có thể thu thập dữ liệu từ kết quả đầu ra đó,
máy dự đoán của bạn có thể học hỏi liên tục thông qua phản hồi.
Quyết định liên quan đến dữ liệu
Dữ liệu thường sẽ rất tốn kém để có được, nhưng máy dự đoán không thể
hoạt động mà không có nó. Máy dự đoán cần dữ liệu để tạo ra, hoạt động
và cải thiện.
Do đó, bạn phải đưa ra quyết định về quy mô và phạm vi của việc thu thập
dữ liệu. Bạn cần bao nhiêu loại dữ liệu khác nhau? Cần bao nhiêu đối
tượng khác nhau để đào tạo máy? Tần suất bạn cần thu nhập dữ liệu? Càng
nhiều loại, càng nhiều đối tượng, tần suất càng lớn đồng nghĩa với giá
thành càng cao nhưng càng có khả năng thu lợi nhuận lớn. Khi suy nghĩ về
quyết định này, bạn cần phải cẩn thận xác định điều bạn muốn dự đoán.
Vấn đề dự đoán cụ thể sẽ nói cho bạn biết bạn cần cái gì.
Cardiogram muốn dự đoán số lần đột quỵ. Họ sử dụng nhịp tim bất thường
như là một sự đại diện (đã được chứng nhận về mặt y khoa).4 Một khi họ
đặt ra mục tiêu dự đoán, họ chỉ cần dữ liệu nhịp tim của mỗi người dùng
ứng dụng. Họ có thể cần thông tin về giấc ngủ, hoạt động thể chất, gia đình,
bệnh sử và tuổi tác. Sau khi hỏi một vài câu hỏi để thu nhập thông tin về
tuổi tác và những thông tin khác, họ chỉ cần một thiết bị để đo lường chuẩn
nhịp tim.
Cardiogram cũng cần dữ liệu để đào tạo – 6.000 người trong hệ thống dữ
liệu đào tạo của họ, một phần trong số đó có nhịp tim bất thường. Mặc dù
có nhiều loại máy cảm biến và nhiều chi tiết khác nhau về người dùng có
thể có sẵn, Cardiogram chỉ cần thu nhập số lượng ít thông tin về hầu hết
người dùng của họ. Và họ chỉ cần thông tin về nhịp tim bất thường từ
những người mà họ dùng để đào tạo máy AI của họ. Bằng cách này, số biến
là tương đối nhỏ.