được khắc phục khi các kỹ năng như Varian tuyên bố trở nên
phổ biến. Hơn nữa, có một niềm tin sai lầm rằng chỉ vì có quá
nhiều dữ liệu xung quanh, nên việc lấy dữ liệu là miễn phí hoặc
giá trị của nó là ít ỏi. Trong thực tế, dữ liệu là thành phần quan
trọng. Để hiểu được tại sao, hãy xem xét các thành phần khác
nhau của chuỗi giá trị dữ-liệu-lớn, và chúng sẽ có thể thay đổi
như thế nào theo thời gian. Để bắt đầu, chúng ta hãy xem xét lần
lượt từng loại - người sở hữu dữ liệu, chuyên gia dữ liệu, và tu
duy dữ-liệu-lớn.
Chuỗi giá trị dữ-liệu-lớn
Thứ cơ bản tạo nên dữ liệu lớn là bản thân thông tin. Chủ sở hữu
dữ liệu có thể không thực hiện công việc sưu tập ban đầu,
nhưng họ kiểm soát việc truy cập thông tin và sử dụng nó cho
chính họ hoặc cấp phép cho những người khác để tận dụng giá
trị của nó. Ví dụ ITA Software, một mạng giữ chỗ hàng không
lớn (sau Amadeus, Travelport, và Sabre), đã cung cấp dữ liệu cho
Farecast để dự báo giá vé máy bay, nhưng không tự tiến hành
các phân tích. Tại sao không? ITA nhìn nhận việc kinh doanh
của họ là sử dụng dữ liệu cho các mục đích mà nó được thiết kế -
bán vé máy bay - chứ không phải cho các ứng dụng phụ trợ. Như
vậy, những năng lực cốt lõi của nó là khác. Hơn nữa, nó sẽ phải
làm việc xung quanh bằng sáng chế của Etzioni.
Công ty cũng quyết định không khai thác dữ liệu do vị trí của nó
trong chuỗi giá trị thông tin. “ITA tránh xa các dự án nào khiến
cho việc ứng dụng thương mại của dữ liệu có liên quan chặt chẽ
tới doanh thu trong ngành hàng không”, Carl de Marcken, người
đồng sáng lập và cựu giám đốc công nghệ của ITA Software, nhớ
lại. “ITA có quyền truy cập đặc biệt tới loại dữ liệu như vậy vì
chúng rất cần cho việc cung cấp dịch vụ của ITA, nên không thể