DỮ LIỆU LỚN - Trang 33

việc với chỉ một ít dữ liệu vì các công cụ để thu thập, tổ chức,
lưu trữ, và phân tích nó rất nghèo nàn. Chúng ta sàng lọc thông
tin, giữ lại mức tối thiểu vừa đủ để có thể khảo sát được dễ dàng
hơn. Đây là một hình thức của tự kiểm duyệt vô thức: chúng ta
xử lý các khó khăn trong việc tương tác với dữ liệu như thể đó là
những chuyện không may, chứ không phải như bản chất thật
của nó - một hạn chế nhân tạo bị áp đặt bởi công nghệ vào thời
điểm đó. Ngày nay, môi trường kỹ thuật đã thay đổi 179 độ. Vẫn
còn, và luôn luôn sẽ còn, một hạn chế về dung lượng dữ liệu
chúng ta có thể quản lý, nhưng hạn chế đó là ít hơn nhiều so với
trước đây và sẽ càng ít hơn trong tương lai.

Theo một số cách nào đó, chúng ta vẫn chưa hoàn toàn đánh giá
cao sự tự do mới của mình trong việc thu thập và sử dụng
những khối lớn dữ liệu. Hầu hết kinh nghiệm và thiết kế tổ chức
của chúng ta đã giả định rằng sự sẵn có của thông tin là hạn chế.
Chúng ta chấp nhận chỉ có thể thu thập được một ít thông tin,
và đó thường là những gì chúng ta đã làm. Nó đã trở thành sự tự
thỏa mãn.

Chúng ta thậm chí còn phát triển các kỹ thuật phức tạp để sử
dụng ít dữ liệu nhất có thể. Xét cho cùng, một mục đích của
thống kê là để xác nhận một điều khám phá tuyệt vời nhất bằng
cách sử dụng lượng dữ liệu ít nhất. Trong thực tế, chúng ta đã
hệ thống hóa việc thực thi của mình để bóp nghẹt lượng thông
tin chúng ta sử dụng trong các định mức, tiến trình, và cơ chế
khuyến khích. Để có được một sự hình dung về ý nghĩa của sự
chuyển dịch tới dữ liệu lớn, câu chuyện bắt đầu với một cái nhìn
ngược thời gian.

Cho đến gần đây các công ty tư nhân, và ngày nay ngay cả các cá
nhân, đã có thể thu thập và sắp xếp thông tin trên một quy mô
lớn. Trước đây, công việc này thuộc các tổ chức lớn hơn như nhà

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.