Nén ảnh số
199
Chương 13
13.
NEÙN AÛNH SOÁ
Mục đích của việc nén ảnh số là mã hoá các dữ liệu ảnh về một dạng thu gọn, tối thiểu hoá cả
số bits dùng để biểu diễn ảnh lẫn các sai khác do quá trình nén gây ra. Tầm quan trọng của
vấn đề nén ảnh có thể thấy rõ qua các số liệu cụ thể: với một bức ảnh trắng đen kích thước
512x512 pixels, mỗi pixel được biểu diễn bởi 8 bits (biểu diễn một trong 256 giá trị mức
xám), cần khoảng 256 Kbytes dữ liệu. Với ảnh màu cần gấp ba lần con số này. Với các dữ
liệu video, cần 25 frames trên một giây, như vậy 1 đoạn video chỉ 30s phải cần đến 540MB
dữ liệu, một con số quá lớn. Do đó vấn đề nén ảnh là hết sức cần thiết.
Nói chung, các phương pháp nén ảnh chủ yếu được phân thành 2 nhóm: nhóm không tổn hao
và nhóm có tổn hao. Các phương pháp nén ảnh không tổn hao cho phép biểu diễn ảnh với
chất lượng hoàn toàn ngang bằng với ảnh gốc. Các phương pháp này dựa trên các giải thuật
nén được áp dụng cho tất cả các đối tượng dữ liệu nói chung chứ không chỉ riêng dữ liệu ảnh,
ví dụ mã Huffman, mã số học, mã Golomb, ... Tuy nhiên, các phương pháp này không lợi
dụng được những đặc tính riêng của dữ liệu ảnh và tỷ lệ nén rất thấp. Do đó, trong thực tế, các
phương pháp nén có tổn hao là các phương pháp được sử dụng chủ yếu. Với các phương pháp
này, luôn có sự đánh đổi giữa dung lượng ảnh với chất lượng ảnh.
13.1. PHÖÔNG PHAÙP MAÕ HOAÙ XÖÛ LYÙ KHOÁI BTC (BLOCK TRUNCATING CODING)
Ý tưởng cơ bản của phương pháp này là chia ảnh ra thành nhiều khối 4x4 và lượng tử hoá các
pixel trong khối về hai giá trị a và b. Trong mỗi khối, cần tính giá trị trung bình x và độ lệch
chuẩn
σ để thực hiện mã hoá. Quá trình lượng tử hai mức được thực hiện đối với các pixel
trong mỗi khối sao cho bit 0 được dùng biểu diễn cho các giá trị nhỏ hơn giá trị trung bình, và
bit 1 biểu diễn các mức xám của các pixel còn lại. Ảnh sẽ được tái tạo từ các giá trị x và σ và
từ ma trận các bit dữ liệu mã hoá (còn gọi là mặt phẳng bit) bằng cách gán các giá trị mức
xám a và b cho các bit 0 và 1 tương ứng:
q
a x
m q
σ
= −
−
(13.1)
m q
b x
q
σ
−
= +
(13.2)
trong đó m (=16) là tổng số pixel trong mỗi khối, q là số bit 1 trong mặt phẳng bit. Các giá trị
lượng tử được chọn như trên để giá trị trung bình và variance của ảnh vẫn được bảo toàn sau
khi giải nén, do đó phương pháp này còn gọi là phương pháp mã hoá xử lý khối bảo toàn
moment (MPBTC - moment preserving BTC). Một dạng khác của phương pháp BTC là
phương pháp BTC moment tuyệt đối (AMBTC – absolute moment BTC) chọn các giá trị
lượng tử a và b là các giá trị trung bình của các pixels trong hai nhóm (nhóm bit 1 và nhóm bit
0):
1
.
i
i
x x
a
x
m q
<
=
−
∑
(13.3)
1
.
i
i
x x
b
x
q
>
=
∑
(13.4)