DỮ LIỆU LỚN - Trang 26

vậy cũng đủ tốt rồi. Dữ liệu lớn là về cái gì, chứ không về tại sao.
Chúng ta không luôn luôn cần biết nguyên nhân của một hiện
tượng, thay vào đó, chúng ta có thể để cho dữ liệu tự nói.

Trước thời dữ liệu lớn, phân tích của chúng ta thường được giới
hạn vào việc thử nghiệm một số lượng nhỏ những giả thuyết
được xác định rõ ràng trước khi thu thập dữ liệu. Khi để cho các
dữ liệu lên tiếng, chúng ta có thể tạo nên những kết nối mà ta
chưa bao giờ nghĩ là chúng tồn tại. Do đó, một số quỹ đầu tư
phân tích Twitter để dự đoán hiệu suất của thị trường chứng
khoán. Amazon và Netilix căn cứ đề xuất sản phẩm của họ trên
vô số các tương tác của người dùng trên các trang này. Twitter,
Linkedln và Facebook cũng đều quy chiếu “đồ thị xã hội” các
mối quan hệ của người sử dụng để tìm hiểu các sở thích của họ.

Tất nhiên, con người đã phân tích dữ liệu hàng thiên niên kỷ
nay. Chữ viết đã được phát triển ở vùng Lưỡng Hà cổ đại bởi các
quan chức muốn có một công cụ hiệu quả để ghi lại và theo dõi
thông tin. Từ thời Kinh Thánh, các chính phủ đã tổ chức các
cuộc điều tra để thu thập các bộ dữ liệu lớn về công dân của họ,
và tương tự đã hai trăm năm nay, các chuyên gia tính toán thu
thập khối lượng lớn dữ liệu liên quan đến các rủi ro mà họ hy
vọng sẽ hiểu được - hoặc ít nhất là tránh được.

Tuy nhiên, trong thời đại analog, việc thu thập và phân tích dữ
liệu như vậy là vô cùng tốn kém và mất thời gian. Những câu
hỏi mới thường có nghĩa là dữ liệu phải được thu thập lại và việc
phân tích phải bắt đầu lại. Bước tiến lớn đối với việc quản lý dữ
liệu hiệu quả hơn đã xuất hiện cùng với số hóa: giúp cho máy
tính có thể đọc thông tin analog, mà cũng làm cho nó dễ dàng
hơn và rẻ hơn để lưu trữ và xử lý.

Bước phát triển này đã cải thiện hiệu quả đáng kể. Việc thu thập
và phân tích thông tin trước đây phải mất hàng năm, nay có thể

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.