SỨC MẠNH CỦA NHỮNG CON SỐ - Trang 234

Ví dụ, giả sử ta sử dụng toàn bộ data có trong tay mà không suy nghĩ nhiều.
Trong đó có một data bị chệch (hình 4-12 ở trên). Lý do đưa data này vào là
do có thể ngày hôm đó cửa hàng cạnh tranh bên cạnh giảm giá đặc biệt, hay
do ai đó trên mạng truyền tai nhau nên Lượng khách tăng đột biến. Hệ số
tương quan bao gồm Số chệch đó là 0.39.

Nhưng với “phán đoán của người phân tích”, với lý do những ngày đặc thù
đó không cần phải đưa vào phân tích, số chênh lệch bị trừ ra, và Hệ số tương
quan nhảy vọt lên 0.78 (hình 4-12).

Vấn đề quan trọng không phải là cách nào thì đúng, mà chính người phân
tích phải phán đoán, do Số liệu sẽ không chỉ cho ta thấy “làm thế nào thì
tốt”, hay “vì có Số chệch nên hãy lưu ý nhé”.

Nếu chỉ để có kết quả mong muốn mà tùy tiện thêm vào hay bỏ ra Giá trị
chệch này, cuối cùng chỉ mang lại thất bại.

Lượng dữ liệu càng lớn thì càng khó biết được có hay không Giá trị chệch.
Tôi xin gợi ý một cách đơn giản để phát hiện khi nhìn là vẽ biểu đồ phân bố.

(3) Kết quả sẽ khác tùy vào vùng dữ liệu sử dụng (phải xác nhận lại
Mục đích và Giả thuyết)

Tùy vào phạm vi hay vùng phân tích, mà kết quả sẽ rất khác nhau, mặc dù
đều chung dữ liệu gốc. Giống với “giá trị lệch”, dữ liệu không tự động cảnh
báo ta, mà người phân tích phải tự mình phán đoán.

Giả sử ta chỉ sử dụng trục hoành với số liệu là dưới 60 (hình 4-13), trong dữ
liệu nhìn như “không có giá trị lệch” ở hình 4-12. Ví dụ nếu trục hoành là Số
lần sử dụng thiết bị thể thao đó, thì trên 60 lần là những người thường xuyên
sử dụng, dưới 60 là đối tượng ta phân tích để tăng tần suất sử dụng của họ
lên. Trong trường hợp đó, Hệ số tương quan của những người dưới 60 lần
này là 0.45. Ở đây không nói đến cái nào tốt, xấu hay đúng, sai, mà sự thật
là nếu người phân tích không xét đến khía cạnh bối cảnh và phán đoán sai,

Liên Kết Chia Sẽ

** Đây là liên kết chia sẻ bới cộng đồng người dùng, chúng tôi không chịu trách nhiệm gì về nội dung của các thông tin này. Nếu có liên kết nào không phù hợp xin hãy báo cho admin.