DỮ LIỆU LỚN - Trang 81

cách sai lầm. Nếu thất bại thì cuối cùng họ mới phải thừa nhận
rằng giả thuyết, hoặc thậm chí lý thuyết nền tảng của nó, còn
thiếu sót và phải được sửa đổi. Kiến thức phát triển thông qua
quá trình thử-và-sai như thế. Và nó diễn ra quá chậm, vì những
thành kiến cá nhân và tập thể đã che mờ những giả thuyết
chúng ta phát triển, chúng ta áp dụng chúng như thế nào, và do
đó những phương tiện thay thế mà chúng ta đã chọn. Đó là một
quá trình phức tạp, nhưng khả thi trong một thế giới dữ-liệu-
nhỏ.

Trong thời đại dữ-liệu-lớn, việc ra quyết định để khảo sát những
biến nào bằng cách chỉ dựa trên các giả thuyết sẽ không còn
hiệu quả nữa. Các bộ dữ liệu là quá lớn và lĩnh vực được xem xét
có lẽ quá phức tạp. May mắn thay, nhiều trong số những hạn chế
vốn trói buộc chúng ta vào một cách tiếp cận dựa-trên-giả-
thuyết đã không còn tồn tại với cùng mức độ như vậy nữa.
Chúng ta bây giờ có quá nhiều dữ liệu dễ tiếp cận và khả năng
tính toán tới mức không cần phải chăm chỉ chọn một hoặc một
số ít phương tiện đo lường thay thế và khảo sát từng cái. Việc
phân tích điện toán tinh vi bây giờ có thể xác định được phương
tiện tối ưu - như nó đã làm cho Xu hướng Dịch cúm của Google,
sau khi “cày” qua gần nửa tỷ mô hình toán học.

Chúng ta không còn nhất thiết phải đòi hỏi một giả thuyết
chuyên môn về một hiện tượng để bắt đầu hiểu thế giới của
mình. Vì vậy, chúng ta không cần phát triển một khái niệm về
những gì mọi người tìm kiếm khi nào và ở nơi nào bệnh cúm lây
lan. Chúng ta không cần có một ý niệm mơ hồ về cách các hãng
hàng không định giá vé của họ. Chúng ta không cần quan tâm
đến thị hiếu của người mua hàng Walmart. Thay vào đó chúng
ta có thể đặt dữ liệu lớn vào trong phép phân tích tương quan,
để rồi nó sẽ cho chúng ta biết những câu hỏi tìm kiếm nào là các
phương tiện đo lường tốt nhất cho bệnh cúm, liệu giá vé máy

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.