非可逆圧縮とは何か?概念・仕組み・主要コーデックと品質評価を網羅する実務ガイド

非可逆圧縮とは何か — 概念と目的

非可逆圧縮(lossy compression)は、元データを完全には復元できないことを許容してファイルサイズを小さくする圧縮手法です。可逆圧縮(lossless)が情報を完全に保持するのに対して、非可逆は「人間の知覚ではほとんど気づかれない」情報を削ることで高い圧縮率を達成します。主に画像、音声、映像の配信やストレージ最適化で幅広く用いられます。

基本的な仕組み

非可逆圧縮は一般に次のような段階を踏みます。

  • 前処理(色空間変換やフィルタリング、サブサンプリング)
  • 変換(周波数領域への変換:DCT、MDCT、離散ウェーブレット変換など)
  • 量子化(小さい係数を0にし、精度を落とす)
  • 符号化(冗長性を取り除くエントロピー符号化:ハフマン、算術符号化、CABACなど)

重要なのは「量子化」の段階で不可逆性が生まれる点です。そこでどの情報を捨てるかは、対象(視覚/聴覚)の知覚特性に基づくモデル—いわゆる視聴覚モデル(psychoacoustic/psychovisual model)—で決まります。

代表的な方式と特徴

  • JPEG(画像):8×8の離散コサイン変換(DCT)を用いる古典的方式。ブロッキングアーティファクトが発生しやすい。
  • JPEG2000:ウェーブレット変換を使い、可逆/非可逆両対応。高品質や拡張性に優れるが採用は限定的。
  • WebP / JPEG XL / AVIF:近年の画像フォーマット。より高効率な圧縮やモダンな機能(アルファ、アニメーション、高ダイナミックレンジ)を提供。
  • MP3 / AAC / Opus(音声):MDCTや予測フィルタ、心理音響モデルを使う。Opusは低遅延と高効率を両立。
  • H.264/HEVC/AV1/VVC(映像):動き補償、ブロック変換、量子化、多段の符号化で高効率を得る。AV1やVVCは最新世代でさらに効率向上。

なぜ非可逆が有利か — ビット率と知覚のトレードオフ

情報理論的には、同じ品質(知覚上の満足度)を得るために必要なビット数は非可逆圧縮の方が小さく済みます。これは人間の感覚がすべての情報を等しく重視しないためで、たとえば高周波ノイズや近接色の差分は視覚上目立たないことがあります。圧縮設計では「レート—歪み(rate–distortion)最適化」により、与えられたビット数で最小の知覚歪みを目指します。

代表的なアーティファクト(欠点)

  • ブロックノイズ:DCTブロックが目立つ(JPEGに典型)。
  • リングイング(輪郭のぼやけ、ゴースト):高周波の欠落で生じる。
  • バンディング(階調の段差):色階調が滑らかでなくなる。
  • モスキートノイズ:圧縮後に輪郭周辺で帯状ノイズが現れる。
  • 音声のマスキング不足:高周波のサチュレーションや失われたディテールで不自然さが出る。

品質評価と指標

主観評価(人間の聴視感)と客観指標の併用が一般的です。客観指標としてはPSNR(ピーク信号対雑音比)が古典的ですが、知覚品質との相関は限定的です。SSIM(構造類似性指標)、MS-SSIM、最近ではNetflixなどが開発したVMAFのような機械学習ベースの指標が、実際の主観評価と良く一致します。

用途に応じた選択基準

  • ウェブ配信:帯域とロード時間の制約があるため高圧縮(WebP/AVIF/JPEG XL)が有利。ただしブラウザ互換性やエンコード時間に注意。
  • 音声ストリーミング:低レイテンシが必要ならOpus、音楽配信ではAACや高ビットレートのエンコーダが選ばれる。
  • 映像配信:配信コスト重視ならAV1やHEVC、リアルタイム用途ではH.264/AVCや低遅延設定のコーデックが使われる。
  • アーカイブ:長期保存や再編集を考えるなら可逆保存(PNG、FLAC、可逆ビデオ)を検討すべき。

実務的な注意点とベストプラクティス

  • 再エンコードを繰り返さない:非可逆は劣化が累積する。編集ワークフローはできるだけ原本→最終配信用エンコードの一本化を。
  • 高圧縮時は視覚テストを行う:自動評価だけでなく実機の視聴/表示確認を必ず行う。
  • カラースペースとサブサンプリングを理解する:4:2:0などのクロマサブサンプリングは肌色や細線で色ムラを招くことがある。
  • フォールバックの用意:AVIFやJPEG XLは高効率だが、対応端末が限定される場合はWeb向けにフォールバックを提供する。

最新動向と将来

近年は機械学習(ニューラル圧縮)を用いたコーデックが研究・実用化段階にあります。ニューラル符号化器は画像や映像をコンテンツ依存に最適化して高効率化を実現します。標準規格側でもAV1やVVC(H.266)、JPEG XLといった次世代技術が普及を進めており、計算コストと特許問題の調整が鍵となります。

まとめ — いつ非可逆を使うか

非可逆圧縮は、帯域やストレージを節約しつつ視聴者にとって実用上問題のない品質を提供するための強力な手段です。ただし、アーカイブや法的証拠など完全性が求められるケースでは不可逆な情報損失が問題となるため適しません。コンテンツの性質、配信環境、ユーザー体験を考慮して可逆・非可逆を使い分けることが重要です。

参考文献