DỮ LIỆU LỚN - Trang 75

cho khách hàng dựa trên những sở thích mua sắm riêng biệt của
họ? Ngay từ đầu, Amazon đã thu được nhiều dữ liệu về các
khách hàng: những gì họ mua, những cuốn sách nào họ chỉ
nhìn nhưng không mua, và họ nhìn chúng bao lâu. Những cuốn
sách nào họ đã mua cùng nhau.

Số lượng dữ liệu là rất lớn tới mức lúc đầu Amazon đã xử lý nó
theo cách thông thường: lấy một mẫu và phân tích nó để tìm
những điểm tương đồng giữa các khách hàng. Các khuyến nghị
đưa ra là khá thô thiển. Mua một cuốn sách về Ba Lan và bạn sẽ
bị “dội bom” bằng các thông tin về giá vé đi Đông Âu. Mua một
cuốn về trẻ sơ sinh và bạn sẽ bị ngập với thông tin về những
cuốn tương tự. “Họ có xu hướng mời bạn những biến thể nho
nhỏ của những gì bạn mua trước đó, đến vô cùng tận”, James
Marcus, một nhà phê bình sách của Amazon từ 1996 đến 2001,
nhớ lại trong hồi ký của mình mang tên Amazonia. “Cứ như bạn
đi mua sắm với thằng đần vậy”.

Greg Linden nhìn thấy một giải pháp. Ông nhận ra rằng hệ
thống khuyến nghị không nhất thiết phải so sánh khách hàng
với những người khác, một công việc phức tạp về kỹ thuật. Tất
cả những gì cần thiết là tìm ra những liên kết giữa chính các sản
phẩm với nhau. Năm 1998 Linden và đồng nghiệp của ông đã
đăng ký một bằng sáng chế về kỹ thuật lọc cộng tác được gọi là
“item-to-item” (“từ-mục-đến-mục”). Sự thay đổi trong cách tiếp
cận đã làm nên một sự khác biệt lớn.

Bởi các tính toán có thể được thực hiện trước thời hạn, nên các
khuyên nghị là rất nhanh. Phương pháp này cũng linh hoạt, có
khả năng làm việc trên nhiều loại sản phẩm. Vì vậy, khi Amazon
chuyển sang bán các mặt hàng khác với sách, hệ thống cũng có
thể đề xuất phim hoặc lò nướng bánh. Và các khuyến nghị là tốt
hơn nhiều so với trước vì hệ thống sử dụng tất cả các dữ liệu.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.