chuyển dữ liệu đến nơi nó sẽ được phân tích, Hadoop bỏ qua
những chi tiết như vậy. Thay vào đó, nó nghiễm nhiên chấp
nhận rằng lượng dữ liệu là quá lớn nên không thể di chuyển và
phải được phân tích ngay tại chỗ.
Đầu ra của Hadoop không chính xác bằng của các cơ sở dữ liệu
quan hệ: nó không đáng tin để có thể dùng cho việc khởi động
một con tàu vũ trụ hoặc xác nhận các chi tiết tài khoản ngân
hàng. Nhưng đối với nhiều công việc ít quan trọng hơn, khi một
câu trả lời cực kỳ chính xác là không cần thiết, thì nó thực hiện
thủ thuật nhanh hơn rất nhiều so với các hệ thống khác. Hãy
nghĩ tới những công việc như phân chia một danh sách khách
hàng để gửi tới một số người một chiến dịch tiếp thị đặc biệt. Sử
dụng Hadoop, công ty thẻ tín dụng Visa đã có thể giảm thời gian
xử lý hồ sơ kiểm tra của hai năm, khoảng 73 tỷ giao dịch, từ một
tháng xuống chỉ còn 13 phút. Việc tăng tốc xử lý như vậy là
mang tính đột phá đối với các doanh nghiệp.
Kinh nghiệm của ZestFinance, một công ty được thành lập bởi
cựu giám đốc thông tin của Google, Douglas Merrill, nhấn mạnh
điểm này. Công nghệ của nó giúp người cho vay quyết định có
hay không cung cấp những khoản vay ngắn hạn tương đối nhỏ
cho những người có vẻ như có điểm tín dụng kém. Tuy nhiên,
trong khi điểm tín dụng truyền thống là chỉ dựa trên một số ít
tín hiệu mạnh như các thanh toán chậm trước đây, thì
ZestFinance phân tích một số lượng lớn các biến “yếu kém”.
Trong năm 2012, nó đã tự hào đưa ra một tỷ giá mặc định cho
các khoản vay, một phần ba ít hơn so với mức trung bình trong
ngành. Nhưng cách duy nhất để làm cho hệ thống hoạt động là
chấp nhận sự hỗn độn.
“Một trong những điều thú vị”, Merrill nói, “là không có ai mà
tất cả các trường thông tin đều được điền đủ. Luôn luôn có một