DỮ LIỆU LỚN - Trang 257

cung cấp cho mỗi bất động sản một định danh dựa theo quận,
khu phố và mảnh đất. Cảnh sát sử dụng tọa độ Descartes. Sở cứu
hỏa lại trông cậy vào một hệ thống khoảng cách tới các “hộp
gọi” tương ứng với vị trí của các trạm cứu hỏa, mặc dù những
hộp gọi không còn tồn tại nữa. “Những đứa trẻ” của Flowers đã
đối mặt với sự hỗn độn này bằng cách đặt ra một hệ thống định
danh các tòa nhà theo phương thức sử dụng một khu vực nhỏ ở
phía trước bất động sản dựa trên tọa độ Descartes, và sau đó rút
ra dữ liệu vị trí từ những cơ sở dữ liệu của các cơ quan khác.
Phương pháp của họ vốn không chính xác, nhưng số lượng lớn
các dữ liệu họ có thể sử dụng đã bù đắp lại cho những khiếm
khuyết này.

Tuy nhiên các thành viên trong nhóm đã không thỏa mãn khi
chỉ xử lý những con số. Họ đã đi thực địa để xem những thanh
tra làm việc. Họ đã ghi chép rất nhiều và hỏi các chuyên gia về
mọi thứ. Khi một chỉ huy tóc hoa râm lầm bầm rằng tòa nhà họ
sắp kiểm tra không có vấn đề gì đâu, các thành viên trong nhóm
nghiên cứu đều hỏi tại sao ông lại cảm thấy chắc chắn như vậy.
Ông ta có thể không hoàn toàn nói ra, nhưng “những đứa trẻ”
dần xác định được rằng trực giác của ông ta là dựa trên những
viên gạch mới ở ngoại thất của tòa nhà, điều khiến ông ta nghĩ
rằng người chủ sở hữu quan tâm đến nơi này.

“Những đứa trẻ” trở lại nơi làm việc và tự hỏi làm thế nào để đưa
yếu tố “phần gạch mới xây” vào mô hình của họ như một tín
hiệu. Xét cho cùng, những viên gạch đâu có được dữ liệu hóa -
đúng ra là chưa! Nhưng chắc chắn rằng bất kỳ phần xây mới bên
ngoài nào cũng phải có giấy phép của thành phố để thực hiện.
Thế là việc thêm thông tin giấy phép đã cải thiện hiệu suất dự
đoán của hệ thống, khi cho thấy một số tòa nhà trong diện
“đáng ngờ” có lẽ không mang những rủi ro lớn.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.