営業:平日8:00~17:30 定休日:土日祝
TIFFとは? (後編) 色々な圧縮形式をスッキリ解説
G4 FAX、PackbitsにLZW···分かりやすいまとめページです
TIFFの圧縮形式一覧
■TIFFの代表的な圧縮形式は以下の通りです。
標準仕様
- ① 非圧縮
- ② PackBits / パック・ビット
- ③ RLE:Run Length Encoding / ランレングス (CCITT Group3 1-Dimentional Modified Huffman run length)
拡張仕様
- ④ Group 3 Fax (CCIT Bilevel Encodings G3 FAX T.4)
- ⑤ Group 4 Fax (CCIT Bilevel Encodings G4 FAX T.6)
- ⑥ LZW (Lempel-Ziv-Welch:作者の名前にちなんで命名)
- ⑦ Deflate / デフリート
- ⑧ JPEG (画像形式ではなく圧縮形式としてのJPEG)
TIFFの圧縮形式の詳細説明
① 非圧縮
・カラー / モノクロとも
非圧縮で保存した場合、何度保存を繰り返しても画質が劣化しません。ただし画像情報が詳細なためファイルサイズが非常に大きくなります。
② Packbits:パック・ビット
・カラー / モノクロとも
・可逆圧縮
圧縮率が全体的にあまり高くなく、グラフィック画像などではPackbitsで圧縮したほうが無圧縮よりも大きくなるケースもあります。
したがって古いMacintoshではよく使われた圧縮形式ですが、その後広く普及することはありませんでした。
③ RLE (Run Length Encoding):ランレングス圧縮 (CCITT Group3 1-Dimentional Modified Huffman run length)
・カラー / モノクロとも
・MH方式 (Modified Huffmanの略)、連長圧縮とも呼ばれます。
・可逆圧縮
カラーに対応しているため以前はよく利用されていた圧縮方法です。
しかしながら連長圧縮の名前の通り、モノクロのように同じデータが連続する形 (例:白白白白黒黒黒) にならないと圧縮率が上がらないため、様々なデータが並ぶカラー画像では圧縮してもデータサイズは小さくなりにくいという性質を持っています。
④ Group 3 Fax (CCIT Bilevel Encodings G3 FAX T.4)
・モノクロのみ
・MR方式
・可逆圧縮
FAX通信用に開発されたモノクロ2値の圧縮形式。広く一般のアナログ電話回線で用いられているのはこのG3 FAX MR方式です。
回線状態の不具合からFAX通信中にエラーが発生してもその影響を数行でとどめ、通信を続けることができるようなコードが含まれています。
⑤ Group 4 Fax (CCIT Bilevel Encodings G4 FAX T.6)
・モノクロのみ
・MMR方式
・可逆圧縮
FAX通信用に開発されたモノクロ2値の圧縮形式で、ISDN回線専用の方式です。
ISDNのデジタル通信を前提としているため、エラー処理のコードは一切含まれていません。そのためG3 FAXより圧縮率が高くなっています。
FAXと違いエラーを気にする必要がない上に、G3 FAXより圧縮率が高いため、ドキュメントスキャナーや複合機でモノクロ2値のデータを保存する際によく使用される保存形式です。A4サイズのモノクロTIFFの無圧縮のデータを100としたときに、7.2%まで圧縮することができます。
複合機の設定内のMH・MR・MMR
※MH、MR、MMRの表記は複合機のスキャン設定の画面などに使われていて、圧縮率はMH<MR<MMRの順に高くなり、保存データ量は小さくなります。
モノクロTIFFデータの圧縮形式と保存後のデータ量
№ | 圧縮形式 | データ量 | 元データ比率 | 圧縮方式 |
---|---|---|---|---|
① | 非圧縮 | 1,640KB | 100.0% | × |
② | Packbits | 380KB | 23.2% | 可逆 |
③ | MH | 198KB | 12.1% | 可逆 |
④ | G3 FAX MR | 149KB | 9.1% | 可逆 |
⑤ | G4 FAX MMR | 118KB | 7.2% | 可逆 |
⑥ | LZW | 489KB | 29.8% | 可逆 |
(A4サイズの原稿を400dpiで白黒スキャンした一例)
⑥LZW Compression (Lempel-Ziv-Welch:開発者3名の名前の頭文字をとって命名)
・カラー / モノクロとも
・可逆圧縮
■UNISYSの特許問題に翻弄された圧縮形式
GIF形式およびTIFF形式の圧縮・展開の際に用いられるLZWのアルゴリズムは、1985年に米Unisys社が「高速データ圧縮及び解凍」 (High Speed Data Compression and Decompression) として特許を取得しました。イギリス、ドイツ、フランス、イタリア、カナダでも取得し、日本でも「デジタル信号ストリーム圧縮方法及び圧縮装置」として特許が成立しました。
■突然のライセンス要求
当初は商用でなければライセンスの取得は必要ないとの立場でしたが、GIF形式がインターネットのスタンダードとして認知された頃、1994年に「商用のソフトの開発元」に対してライセンス契約料を要求するようになりました。
■さらにフリーウェアまでも
1999年には「非商用のフリーウェアであっても、個別にライセンス交渉を行わないウェブサイトに対して、一律5,000ドルの特許料を徴収する」との方針を打ち出したことから、契約しないと告訴されるのではと世界中に混乱が広がりました。
こうした事態を受けて、Web技術の世界ではGIF形式の代わりにオープンソースでフリーなPNG形式が広がることになり、TIFF形式の圧縮技術としてのLZWもこのライセンス問題を受けてGIF同様にその後の採用が見送られることとなりました。
■特許権の失効
しかしその後Unisys社はLZWの特許の延長申請をしなかったために、米では2003年6月20日に、日本でも2004年6月20日に同社の権利は失効しました。
これを受けて現在では、GIF形式はGIFアニメーションなどのWeb表示技術として復活し、GIF形式を扱うフリーソフトなども再び広く公開されるようになりました。同様にTIFFの圧縮形式としてのLZWもドキュメントスキャナーや複合機のTIFFの圧縮などで一般的に用いられるようになっています。
■現在のLZW
今ではカラーTIFFの圧縮形式として、スキャナーや複合機の設定画面内にLZWが採用されているのをよく見ることが出来ます。
カラーTIFFデータの圧縮形式とデータ量
№ | 圧縮形式 | 保存後データ量 | 元データ比率 | 圧縮方式 |
---|---|---|---|---|
① | 非圧縮 | 12,184KB | 100.0% | × |
② | Packbits | 11,660KB | 95.7% | 可逆 |
⑥ | LZW | 9,320KB | 76.5% | 可逆 |
⑦ | Deflate | 7,639KB | 62.7% | 可逆 |
⑧ | JPEG | 1,937KB | 15.9% | 不可逆 |
(A4サイズの原稿を400dpiでカラースキャンした一例)
※JPEGの圧縮率は標準の5を使用
⑦Deflate:デフレート
・カラー / モノクロとも
・可逆圧縮
Deflateは英語では「しぼませる」という意味の単語です。
LZ77 (スライド辞書法) 系のLZSSというアルゴリズムを用いて符号化します。まず繰り返しのデータを圧縮するのですが、AAAAAAAという7桁のデータを、「A7」という2桁のデータに置き換えていくイメージです。
ここで得られた結果をハフマン符号で再度符号化するのですが、こちらは偏りのあるデータを再定義することで出来る限り短いデータに置き換えます。
圧縮速度は比較的高速で、さらに展開速度は非常に高速なのですが、圧縮率はあまり高くありません。
しかしながら上の表から分かる通り、カラーTIFFの圧縮方法としては、PackbitsやLZWと比べてより高い圧縮率になっています。
様々なものに用いられているDeflateアルゴリズム
- 圧縮アルゴリズム : ZIP、gzip、7-Zip、zlib
- 画像圧縮 : PNG、APNG
- その他応用 : HTTP圧縮
- プログラミング言語・環境 : Java、PHP、Ruby、Python、.NET Franework 2.0以降
⑧JPEG:ジェイペグ
・カラー / モノクロとも
・不可逆圧縮
ここで言うJPEGとは、拡張子が.jpgまたは.jpegの「JPEGファイル形式」ではありません。拡張子が.tifまたは.tiffの「TIFFファイル形式」における圧縮形式としてのJPEGのことを指します。
JPEGファイル形式の保存の際と同様に、圧縮率を高くするほどファイルサイズが小さくなり画像品質は落ちていきます。
圧縮の際に落ちた画質は元には戻らない不可逆圧縮です。また同じ圧縮率でもグラフィックソフトで保存を繰り返すほどに画質は劣化していきます。