DỮ LIỆU LỚN - Trang 63

toán như trợ cấp an sinh xã hội và lãi suất trả cho những trái
phiếu nhất định.

Để có được chỉ số này, Cục Thống kê Lao động sử dụng hàng
trăm nhân viên để gọi điện, gửi fax, ghé thăm các cửa hàng và
văn phòng tại 90 thành phố trên toàn quốc và báo cáo lại
khoảng 80.000 mức giá về tất cả mọi thứ từ giá cà chua tới giá đi
taxi. Để có nó, người ta phải chi ra khoảng 250 triệu USD một
năm. Với số tiền này, dữ liệu được gọn gàng, sạch sẽ và trật tự.
Nhưng tại thời điểm các con số được công bố, chúng đã chậm
mất vài tuần. Như cuộc khủng hoảng tài chính năm 2008 cho
thấy, một vài tuần có thể là một sự chậm trễ khủng khiếp.
Những người ra quyết định cần truy cập nhanh hơn đến các số
liệu lạm phát để ứng phó với nó tốt hơn, nhưng họ không thể
nhận được chúng với những phương pháp thông thường tập
trung vào lấy mẫu và coi trọng sự chính xác.

Để đáp lại, hai nhà kinh tế tại Viện Công nghệ Massachusetts,
Alberto Cavallo và Roberto Rigobon, đã tạo ra một phương pháp
thay thế liên quan đến dữ-liệu-lớn, bằng cách đi theo một con
đường hỗn độn hơn nhiều. Sử dụng phần mềm để thu thập dữ
liệu web, họ đã có được nửa triệu giá của các sản phẩm được bán
ở Mỹ mỗi ngày. Các thông tin là lộn xộn, và không phải tất cả các
điểm dữ liệu thu thập được đều có thể dễ dàng so sánh với nhau.
Nhưng bằng cách kết hợp bộ sưu tập dữ-liệu-lớn với phân tích
thông minh, dự án đã có thể phát hiện một dao động giảm phát
trong giá ngay sau khi ngân hàng Lehman Brothers đệ đơn xin
phá sản vào tháng 9 năm 2008, trong khi những nơi phụ thuộc
vào số liệu CPI chính thức đã phải chờ tới tháng Mười Một để
nhìn thấy nó.

Dự án của MIT sau này đã tách ra thành một công ty thương mại
gọi là PriceStats được các ngân hàng và những công ty khác sử

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.