ma túy, bệnh tật, và sâu bệnh. Một mớ dây cáp điện có thể chạy
ngoằn ngoèo trong các bức tường, còn những tấm sưởi bị bỏ
một cách nguy hiểm trên những khăn trải giường. Những người
sống chật trội như vậy thường xuyên bị chết trong các đám
cháy. Năm 2005 hai nhân viên cứu hỏa đã thiệt mạng khi cố
gắng giải cứu người dân. Thành phố New York có khoảng
25.000 khiếu nại về chuyển đổi bất hợp pháp mỗi năm, nhưng
chỉ có 200 thanh tra để xử lý chúng. Dường như không có cách
nào tốt để loại ra những trường hợp chỉ đơn giản là phiền hà từ
những người dễ bốc hỏa. Tuy nhiên đối với Flowers và những
đứa trẻ của ông, điều này trông giống như một bài toán có thể
được giải với rất nhiều dữ liệu.
Họ bắt đầu với một danh sách của các bất động sản trong thành
phố - tất cả có 900.000. Tiếp theo, họ bổ sung dữ liệu từ 19 cơ
quan khác nhau cho biết các thông tin như liệu chủ sở hữu tòa
nhà có vi phạm quy định trả tiền thuế bất động sản, từng có thủ
tục tố tụng tịch thu nhà, có những bất thường trong việc sử
dụng các dịch vụ tiện ích, hoặc bị cắt dịch vụ vì không thanh
toán. Họ cũng đưa vào thông tin về loại hình của tòa nhà và khi
nào nó được xây dựng, cộng với những lần gọi xe cứu thương, tỷ
lệ tội phạm, khiếu nại... Sau đó, họ so sánh tất cả các thông tin
này đối với năm năm của dữ liệu về các vụ cháy được xếp hạng
theo mức độ nghiêm trọng và tìm kiếm những mối tương quan
để tạo ra một hệ thống có thể dự đoán được những khiếu nại
nào phải được điều tra khẩn cấp nhất.
Ban đầu, phần lớn các dữ liệu không phải ở dưới hình thức có
thể sử dụng được. Ví dụ các cơ quan lưu trữ của thành phố đã
không sử dụng một cách thức tiêu chuẩn đơn nhất để mô tả vị
trí, mỗi cơ quan và bộ phận dường như có cách tiếp cận riêng
của mình. Sở công trình gán mỗi cấu trúc với một số nhà duy
nhất. Sở bảo quản nhà ở có một hệ thống đánh số khác. Sở thuế