Dễ, chắc ăn làm trước
Trước số lượng dữ liệu khổng lồ, khó lọc lựa, cách làm của các nhà báo
là “dễ làm trước”.
Phần bóc tách đầu tiên là bảng danh sách đăng bộ của 214.488 công ty
bình phong mà Công ty luật Mossack Fonseca đã thành lập giúp hoặc quản
lý giúp trong giai đoạn từ năm 1977 (lúc công ty thành lập) cho đến năm
2015 (thời điểm tin tặc chấm dứt lấy tài liệu của Công ty luật Panama).
Với hồ sơ mỗi công ty đó luôn kèm theo một loạt tài liệu dưới nhiều định
dạng (PDF, hình ảnh, văn bản Word, văn bản Powerpoint, các bảng biểu và
thậm chí là bản ghi âm), qua đó những người giải mã có thể biết được hoạt
động thật của công ty cũng như những người thụ hưởng đích thực từ công
ty bình phong này.
Một phần việc khó với các nhà báo điều tra là đối diện với ngồn ngộn
những tư liệu “như mớ hổ lốn”.
May mắn là ICIJ đã quen với việc xử lý những loại dữ liệu hỗn tạp này
nên đã mời một số công ty phần mềm nhỏ tham gia làm giúp những công
cụ xử lý chuyên biệt giúp phân loại tư liệu, thậm chí cả với những văn bản
scan nhờ vào hệ thống nhận diện chữ.
Những phần mềm này được chuyển cho các thành viên tham gia cuộc
giải mã tư liệu.
Nhóm các nhà báo tham gia cuộc điều tra cũng được trang bị công cụ tìm
kiếm giúp truy tìm tư liệu liên quan đến từ khóa là một tên người, tên công
ty hoặc một cụm từ. Các nhà báo có hai cách tiếp cận tìm kiếm dữ liệu.
Đầu tiên là tìm kiếm một cụm từ có thể từ đó giúp lần ra manh mối cho
một chủ đề. Ví dụ nhóm nhà báo ở Pháp sẽ tìm cụm từ “hộ chiếu Pháp” với
hi vọng từ đó có thể tìm ra được một cái tên nổi tiếng nào đó, đến một công
ty Pháp hoặc một hướng đi khả dĩ.
Hoặc các nhà báo cũng có thể tìm “đại” dựa trên những “mật ngữ” riêng
của Công ty luật Mossack Fonseca như PEP (nhân vật có tiếng trên chính