Năm 2003, Oren Etzioni cần bay từ Seattle tới Los Angeles để dự
lễ cưới em trai của ông. Nhiều tháng trước đó, ông lên mạng và
mua một vé máy bay, tin rằng càng mua sớm, vé càng rẻ. Trên
chuyến bay, do tò mò, Etzioni hỏi người ngồi kế bên xem giá vé
của ông ta là bao nhiêu và ông ta mua khi nào. Hóa ra ông ta trả
thấp hơn nhiều so với Etzioni, mà thậm chí ông ta mới chỉ mua
vé gần đây. Khá tức giận, Etzioni hỏi một hành khách khác và
một hành khách khác nữa. Hầu hết họ đã trả ít tiền hơn.
Với hầu hết chúng ta, ý nghĩa của cảm giác bị lừa có thể đã tiêu
tan khi chúng ta gấp khay bàn ăn trước mặt, dựng thẳng ghế và
khóa thắt lưng an toàn. Nhưng Etzioni là một trong những nhà
khoa học máy tính hàng đầu của Mỹ. Ông nhìn thế giới như một
chuỗi các bài toán dữ-liệu-lớn có thể giải được. Và ông đang làm
chủ chúng từ khi là người đầu tiên tốt nghiệp Đại học Harvard
về chuyên ngành khoa học máy tính vào năm 1986.
Từ căn phòng của mình tại Đại học Washington, ông đã khỏi
xướng những công ty dữ-liệu-lớn trước khi thuật ngữ “dữ liệu
lớn” được biết tới. Ông đã giúp phát triển một trong những công
cụ tìm kiếm Web đầu tiên, MetaCrawler, được đưa ra sử dụng
vào năm 1994 rồi sau được bán cho InfoSpace, lúc đó là một
công ty bất động sản trực tuyến lớn. Ông đã đồng sáng lập
Netbot, trang web mua hàng so sánh lớn đầu tiên, sau đó bán nó
cho Excite. Ông khởi động công ty làm công cụ trích ý nghĩa từ
các văn bản, gọi là ClearForest, sau này được Reuters mua lại.
Trở lại câu chuyện chính, Etzioni quyết tìm ra cách để có thể
biết liệu một giá vé ta thấy trên mạng có phải là một giá tốt hay
không. Một chỗ ngồi trên máy bay là một thương phẩm: mỗi chỗ
về cơ bản là hoàn toàn giống với những chỗ khác trên cùng
chuyến bay. Nhưng giá lại rất khác nhau, dựa trên vô số yếu tố
mà chủ yếu chỉ chính các hãng bay mới biết.