sách. Họ không bao giờ thấy sự cần thiết, hoặc đánh giá cao tiềm
năng đó.
Nhiều công ty hiện nay đang cạnh tranh để chiếm lĩnh thị
trường sách điện tử. Amazon, với máy đọc sách điện tử Kindle
của mình, dường như là người dẫn đầu sớm. Nhưng đây là một
lĩnh vực mà chiến lược của Amazon và Google khác nhau rất
nhiều. Amazon đã dữ liệu hóa sách - nhưng không giống như
Google, họ đã thất bại trong việc khai thác những chức năng
mới của văn bản với vai trò dữ liệu. Je Bezos, người sáng lập và
giám đốc điều hành của công ty, đã thuyết phục hàng trăm nhà
xuất bản để phát hành sách của họ dưới dạng Kindle. Sách
Kindle không phải được tạo từ ảnh của trang sách. Nếu như vậy,
người đọc sẽ không thể thay đổi kích thước chữ hoặc hiển thị
trang sách cả trên màn hình màu và trắng đen. Văn bản được dữ
liệu hóa, không chỉ là số hóa. Thật ra, Amazon đã làm việc đó
cho hàng triệu cuốn sách mới, những gì Google đang cố gắng
cẩn thận đạt được đối với nhiều cuốn sách cũ hơn.
Tuy nhiên, khác với dịch vụ tuyệt vời của Amazon với “những
từ ngữ quan trọng về mặt thống kê” - trong đó sử dụng các thuật
toán để tìm liên kết giữa các chủ đề của sách mà bình thường có
thể không rõ ràng - nhà bán lẻ trực tuyến đã không tận dụng sự
giàu có của từ ngữ cho phân tích dữ-liệu-lớn. Amazon xem việc
kinh doanh sách của mình là dựa trên nội dung độc giả xem,
chứ không phải trên phân tích văn bản dữ liệu hóa. Và để công
bằng, Amazon có thể phải đối mặt với những hạn chế từ các nhà
xuất bản bảo thủ về việc Amazon có thể sử dụng thông tin chứa
đựng trong các cuốn sách của họ như thế nào. Google, một cậu
bé dữ-liệu-lớn hư hỏng sẵn sàng đẩy xa các giới hạn, không
nhận thấy những hạn chế như vậy: bánh mĩ của Google được
phết bơ bằng những cú nhấp chuột, chứ không phải bằng việc
truy cập các đầu sách của người sử dụng. Có lẽ là công bằng khi