xe. Khách hàng, chứ không phải là công ty tư vấn, đã thu hoạch
được quả ngọt từ dữ liệu.
Trong lĩnh vực dữ liệu y tế, chúng ta thấy một ví dụ nổi bật khác
về cách thức các công ty không thuộc lĩnh vực công nghệ có thể
cung cấp các dịch vụ hữu ích như thế nào. Trung tâm MedStar
Washington ở Washington DC làm việc với Microsoft Research
và sử dụng phần mềm Amalga của Microsoft đã phân tích ẩn
danh hồ sơ y tế trong nhiều năm - về nhân khẩu học bệnh nhân,
các kiểm tra, chẩn đoán, điều trị, và nhiều thứ khác nữa - để tìm
cách giảm tỷ lệ tái phát và nhiễm trùng. Đây là một số trong các
khâu tốn kém nhất của chăm sóc sức khỏe, vì vậy bất cứ điều gì
có thể làm giảm những tỷ lệ này đều giúp tiết kiệm rất nhiều.
Kỹ thuật này phát hiện những mối tương quan đáng ngạc
nhiên. Một trong số kết quả của nó là danh sách tất cả các điều
kiện làm tăng khả năng một bệnh nhân xuất viện sẽ phải quay
lại trong vòng một tháng. Có những điều người ta đã biết,
nhưng chưa tìm được giải pháp dễ dàng, ví dụ một bệnh nhân
suy tim sung huyết sẽ nhiều khả năng phải trở lại, do nó là một
tình trạng khó điều trị. Tuy nhiên hệ thống cũng phát hiện một
chỉ báo hàng đầu bất ngờ: trạng thái tinh thần của bệnh nhân.
Xác suất để một người sẽ nhập viện trở lại trong vòng một
tháng sau khi xuất viện tăng lên đáng kể nếu lời khai ban đầu
bao gồm những từ ngữ gợi đến suy nhược tinh thần, chẳng hạn
như “chán nản”. Mặc dù mối tương quan này không cho biết
điều gì để thiết lập quan hệ nhân quả, tuy nhiên nó cho thấy
một sự can thiệp sau khi xuất viện để giải quyết sức khỏe tâm
thần của bệnh nhân sẽ có thể cải thiện được sức khỏe thể chất
của họ, làm giảm tỷ lệ nhập viện trở lại và giảm chi phí y tế. Phát
hiện này, mà máy tính sàng lọc ra được từ kho tàng dữ liệu
khổng lồ, là điều mà một người nghiên cứu dữ liệu có thể không