PHÂN TÍCH DỮ LIỆU TINH GỌN - Trang 79

phải nhìn vào bức tranh lớn hơn về thị trường, vấn đề đang giải quyết và mô
hình kinh doanh chủ chốt của họ.

Tóm lại, dữ liệu định lượng rất tốt để thử nghiệm các giả thiết, nhưng lại rất
vụng về khi phải tạo ra giả thiết mới nếu không kết hợp với nội quan con
người.

NGHIÊN CỨU TÌNH HUỐNG: LÀM SAO ĐỂ NGHĨ NHƯ MỘT
NHÀ KHOA HỌC DỮ LIỆU

Monica Rogati, nhà khoa học dữ liệu tại LinkedIn, cung cấp cho chúng ta 10
cạm bẫy phổ biến các doanh nhân cần tránh khi nghiên cứu dữ liệu mà công
ty khởi nghiệp của họ thu được.

1. Cho rằng dữ liệu là sạch. Làm sạch dữ liệu thu thập thường là công việc
chủ yếu phải thực hiện, và hành động làm sạch đơn giản có thể tiết lộ những
đặc điểm quan trọng. Monica hỏi “Có phải một lỗi đo đạc khiến 30% số liệu
của bạn bị vô giá trị không?”, “Bạn có thực sự có nhiều người dùng đến thế
ở khu vực mã 90210 (Beverly Hills)?” Hãy kiểm tra dữ liệu ngay từ đầu để
đảm bảo chúng hợp lệ và hữu dụng.

2. Không đánh đồng mọi thứ. Giả sử bạn đang lập danh sách các địa điểm
làm đám cưới được yêu thích. Bạn có thể đếm số người bay đến dự đám
cưới, nhưng nếu không tính đến tổng số người đi máy bay đến thành phố
đấy nữa thì bạn sẽ chỉ nhận được một danh sách các thành phố có sân bay
nhộn nhịp mà thôi.

3. Bỏ qua thiểu số. 21 người dùng sản phẩm của bạn hơn một nghìn lần một
ngày có thể là người hâm mộ lớn của bạn, hoặc là mấy đám bám lấy trang
của bạn để lấy nội dung. Dù họ là ai đi nữa thì bỏ qua họ cũng là sai lầm.

4. Tính các thiểu số. Mặc dù 21 người dùng sản phẩm của bạn một nghìn lần
mỗi ngày có vẻ thú vị đứng từ góc nhìn định tính vì họ có thể chỉ ra những
điều bạn không ngờ tới nhưng họ không có tác dụng tốt khi xây dựng mô

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.