DỮ LIỆU LỚN - Trang 159

cải thiện tính xác đáng của các kết quả. Ví dụ nếu nhiều người ở
New York tìm kiếm và mở trang web về Thổ Nhĩ Kỳ, thuật toán
sẽ xếp hạng các trang này cao hơn cho những người khác ở New
York. Ngay cả khi giá trị của dữ liệu giảm đối với một số mục
đích của nó, giá trị tương lai của nó có thể vẫn còn lớn.

Giá trị của dữ liệu xả

Tái sử dụng dữ liệu đôi khi có thể ở một hình thức thông minh
và ẩn. Các công ty web có thể thu thập dữ liệu trên tất cả những
điều mà người sử dụng thực hiện, và sau đó xử lý mỗi tương tác
riêng biệt như một chỉ báo có vai trò là thông tin phản hồi để
phục vụ việc cá nhân hóa trang web, cải thiện dịch vụ, hoặc tạo
ra một sản phẩm kỹ thuật số hoàn toàn mới. Chúng ta sẽ thấy
một minh họa sinh động về điều này trong câu chuyện về hai bộ
kiểm tra chính tả.

Trong suốt hai mươi năm qua, Microsoft đã phát triển một bộ
kiểm tra chính tả mạnh cho phần mềm Word. Nó so sánh một
từ điển thường xuyên được cập nhật của các từ viết đúng chính
tả với dòng các ký tự người sử dụng gõ vào. Từ điển lập danh
sách những từ đã được biết đến, và hệ thống sẽ xem các biến thể
gần đúng nhưng không có trong từ điển là lỗi chính tả để sau đó
sửa. Do sẽ phải tiêu tốn nhiều công sức để sưu tập và cập nhật từ
điển, bộ kiểm tra chính tả của Microsoft Word chỉ có cho những
ngôn ngữ phổ biến nhất. Nó tiêu tốn của công ty hàng triệu đôla
để tạo ra và duy trì sản phẩm.

Bây giờ hãy sang Google. Họ được cho là có bộ kiểm tra chính tả
hoàn thiện nhất thế giới, về cơ bản là cho tất cả các ngôn ngữ
được sử dụng. Hệ thống liên tục cải thiện và bổ sung thêm
những từ mới - kết quả ngẫu nhiên của việc mọi người sử dụng

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.