DỮ LIỆU LỚN - Trang 142

Tìm cách để đưa toàn bộ sức mạnh tính toán của con người vào
sử dụng hiệu quả hơn, von Ahn đã đưa ra một phiên bản kế
nhiệm thích hợp có tên ReCaptcha. Thay vì gõ vào các chữ cái
ngẫu nhiên, người ta gõ vào hai từ, thuộc trong số các dự án
quét văn bản mà chương trình nhận dạng ký tự quang học của
máy tính không thể hiểu được. Một từ được dùng để xác nhận
điều những người dùng khác đã gõ vào và do đó là tín hiệu cho
biết đó là một con người, còn từ kia là một từ mới cần làm rõ
nghĩa. Để đảm bảo tính chính xác, hệ thống hiển thị cùng một
từ không rõ nghĩa cho khoảng năm người khác nhau để họ gõ
vào một cách chính xác trước khi hệ thống tin tưởng đó là đúng.
Dữ liệu này có một ứng dụng chính - để chứng minh người dùng
là con người - nhưng nó cũng có một mục đích thứ hai: để giải
mã những chữ không rõ ràng trong các văn bản số hóa.

Giá trị mang lại là vô cùng lớn, khi ta nghĩ đến chi phí để thuê
người thay thế. Mất khoảng 10 giây mỗi lần sử dụng, 200 triệu
ReCaptcha mỗi ngày - mức hiện tại - sẽ nhân với nửa triệu giờ
một ngày. Mức lương tối thiểu tại Hoa Kỳ là $7,25 một giờ vào
năm 2012. Nếu dùng sức người để làm rõ nghĩa những từ mà
máy tính không hiểu được, sẽ tốn 4 triệu đôla một ngày, hay
hơn 1 tỷ đôla mỗi năm. Thay vào đó, von Ahn thiết kế một hệ
thống để làm điều đó, và thật ra là miễn phí. Điều này có giá trị
tới mức Google đã mua lại công nghệ từ von Ahn vào năm 2009,
và sau đó cung cấp miễn phí cho bất kỳ trang web nào sử dụng.
Ngày nay nó được đưa vào khoảng 200.000 trang web, trong đó
có Facebook, Twitter, và Craigslist.

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.