việc truy cập vào “suối nguồn” phải tốn chi phí.) Nhiều doanh
nghiệp phân tích cú pháp các tweet, đôi khi sử dụng một kỹ
thuật gọi là phân tích cảm xúc, để thu thập toàn bộ phản hồi của
khách hàng hoặc đánh giá tác động của chiến dịch tiếp thị.
Hai quỹ phòng hộ, Derwent Capital ở London và MarketPsych ở
California, đã bắt đầu phân tích các văn bản được dữ liệu hóa
của tweet như các tín hiệu cho đầu tư vào thị trường chứng
khoán. (Các chiến lược kinh doanh thực tế của họ được giữ bí
mật. Thay vì đổ tiền vào các công ty được quảng cáo rùm beng,
có lẽ họ đã đầu tư cho sự suy thoái của chúng.) Cả hai công ty
bây giờ bán các thông tin cho các nhà đầu tư. MarketPsych hợp
tác với Thomson Reuters để cung cấp không dưới 18.864 chỉ số
riêng biệt trên 119 quốc gia, được cập nhật từng phút, dựa trên
các trạng thái cảm xúc như lạc quan, u ám, vui vẻ, sợ hãi, giận
dữ, và ngay cả các chủ đề như đổi mới, kiện tụng, và xung đột.
Dữ liệu được sử dụng bởi con người không nhiều như bởi máy
tính: các thần đồng toán học của Wall Street, được gọi là “những
cây sào”, cắm dữ liệu vào các mô hình thuật toán của họ để tìm
kiếm các mối tương quan vô hình có thể tận dụng để tạo ra lợi
nhuận. Tần số của tweet về một chủ đề có thể dự đoán những
điều khác nhau, chẳng hạn như doanh thu phòng vé của
Hollywood, theo một trong những cha đẻ của phân tích mạng
xã hội, Bernardo Huberman. Ông và một đồng nghiệp ở HP đã
phát triển một mô hình xem xét tốc độ các tweet mới được
đăng. Với điều này, họ đã có thể dự báo về thành công của một
bộ phim tốt hơn so với các dự báo quen thuộc khác.
Nhưng còn có thể làm được nhiều thứ hơn thế nữa. Các tin nhắn
Twitter bị giới hạn trong 140 ký tự, nhưng các siêu dữ liệu - tức
“thông tin về thông tin” - kết hợp với mỗi tweet lại phong phú.
Nó bao gồm 33 mục riêng biệt. Một số mục dường như không