DỮ LIỆU LỚN - Trang 15

Không có một định nghĩa chính xác cho dữ liệu lớn. Ban đầu ý
tưởng là dung lượng thông tin đã tăng quá lớn tới mức số lượng
cần khảo sát không còn vừa vào bộ nhớ các máy tính dùng để xử
lý, do vậy các kỹ sư cần cải tạo các công cụ họ dùng để có thể
phân tích được tất cả thông tin. Đó là xuất xứ của các công nghệ
xử lý mới như MapReduce của Google và nguồn mở tương
đương của nó, Hadoop, khởi đầu từ Yahoo. Những công nghệ
này cho phép ta quản lý những khối lượng dữ liệu lớn hơn nhiều
so với trước đây, và quan trọng là không cần đưa dữ liệu vào các
hàng ngăn nắp hoặc các bảng cơ sở dữ liệu cổ điển. Các công
nghệ nghiền dữ liệu khác, bỏ qua các cấu trúc phân cấp và đồng
nhất cứng nhắc cổ điển, cũng ở trong tầm ngắm. Đồng thời, do
các công ty Internet có thể thu thập được vô số dữ liệu quý giá
và có động cơ kinh tế lớn để khai thác chúng, nên các công ty
này trở thành người sử dụng hàng đầu của các công nghệ xử lý
hiện đại nhất, vượt qua các công ty truyền thống, đôi khi có tới
hàng chục năm kinh nghiệm nhiều hơn.

Một cách để suy nghĩ về vấn đề ngày hôm nay - và cũng là cách
chúng tôi thực hiện trong cuốn sách này - là: dữ liệu lớn đề cập
tới những thứ người ta có thể làm với một quy mô lớn mà không
thể làm với một quy mô nhỏ hơn, để trích xuất những hiểu biết
mới hoặc tạo ra những dạng giá trị mới, theo những cách thức
có thể làm thay đổi các thị trường, các tổ chức, mối quan hệ giữa
các công dân và các chính phủ, và hơn thế nữa.

Nhưng đó chỉ là bước khởi đầu. Thời đại của dữ liệu lớn thách
thức cách chúng ta sống và tương tác với thế giới. Nổi bật nhất,
xã hội sẽ phải cắt giảm một số nỗi ám ảnh của nó về quan hệ
nhân quả để đổi lấy mối tương quan đơn giản, không biết tại sao
mà chỉ biết cái gì. Điều đó làm đổ vỡ hàng thế kỷ các tập quán đã
được thiết lập và thách thức hiểu biết cơ bản nhất của chúng ta

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.