DỮ LIỆU LỚN - Trang 43

năm. “Đây là dữ liệu tạm thời - bạn chỉ cần tiếp tục thu thập nó
theo thời gian, và khi bạn làm như vậy, bạn sẽ có được cái nhìn
ngày càng sâu sắc hơn vào các khuôn mẫu”, Etzioni cho biết.

Vì vậy, chúng ta sẽ luôn thấy ổn khi bỏ con đường tắt lấy mẫu
ngẫu nhiên sang bên và nhắm tới dữ liệu toàn diện hơn để thay
thế. Làm như vậy đòi hỏi phải có sức mạnh xử lý và lưu trữ
phong phú cũng như các công cụ tiên tiến để phân tích tất cả.
Nó cũng đòi hỏi những cách thức dễ dàng và giá cả phải chăng
để thu thập dữ liệu. Trong quá khứ, mỗi thứ này là một thách đố
đắt giá. Nhưng hiện nay chi phí và độ phức tạp của tất cả các
mảnh ghép này đã giảm đáng kể. Những gì trước đây là phạm vi
của chỉ các công ty lớn nhất thì bây giờ lại khả thi cho hầu như
tất cả.

Sử dụng tất cả dữ liệu cho phép phát hiện các kết nối và chi tiết
mà bình thường sẽ bị che giấu trong sự bao la của thông tin. Ví
dụ, việc phát hiện các gian lận thẻ tín dụng hoạt động bằng cách
tìm kiếm những bất thường, và cách tốt nhất để tìm ra chúng là
nghiền tất cả dữ liệu thay vì một mẫu. Các giá trị ngoại lai là
những thông tin thú vị nhất, và bạn chỉ có thể nhận ra chúng
khi so sánh với hàng loạt giao dịch bình thường. Nó là một vấn
đề về dữ liệu lớn. Và bởi vì các giao dịch thẻ tín dụng xảy ra tức
thời, nên việc phân tích thường phải được thực hiện trong thời
gian thực.

Xoom là một công ty chuyên về chuyển tiền quốc tế và được hỗ
trợ bởi những tên tuổi lớn trong lĩnh vực dữ liệu lớn. Nó phân
tích tất cả dữ liệu liên quan tới các giao dịch mà nó xử lý. Hệ
thống tăng mức báo động vào năm 2011 khi nó nhận thấy số
lượng giao dịch thẻ Discovery có nguồn gốc từ New Jersey hơi
cao hơn một chút so với trung bình. “Nó nhận thấy một mô
hình mà đáng ra không được như vậy”, John Kunze, giám đốc

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.