音楽解析で使うスペクトル分析入門:理論・実践・活用テクニック
スペクトル分析とは何か — 音楽での意義
スペクトル分析は、時間領域の音信号を周波数成分に分解して可視化・解析する手法の総称です。音楽においては、ピッチや和音の構造、楽器の持つ倍音(ハーモニクス)や音色(ティンバー)、アタックや減衰など時間的変化に関する情報を抽出するために不可欠です。人間の耳が周波数ごとに異なる感度を持つこと、音楽の多くの特徴が周波数成分に現れることから、スペクトル分析は音楽情報処理(MIR)や音響工学、音楽制作に広く使われます。
基礎理論:フーリエ変換とその離散化
スペクトル分析の基礎はフーリエ変換(Fourier Transform)です。連続時間信号に対するフーリエ変換は、信号を無限に続く正弦波の重ね合わせとして表現します。実際の音声や音楽信号はデジタル化(サンプリング)されるため、離散時間フーリエ変換(DTFT)や離散フーリエ変換(DFT)、および効率的に計算する高速フーリエ変換(FFT)が用いられます。
重要な概念:
- サンプリング周波数(Fs)とナイキスト周波数:サンプリング周波数の半分が解析可能な最高周波数(ナイキスト周波数)で、これを超える成分は折り返し(エイリアシング)を起こします。
- DFTの周波数分解能:DFTのサイズ(N)を大きくするほど周波数刻みが細かくなります。周波数分解能はFs/Nで近似されます。
- 時間分解能 vs 周波数分解能のトレードオフ:長い窓(大きなN)は周波数分解能が高いが時間分解能が低く、短い窓は逆になります(不確定性原理に由来)。
短時間フーリエ変換(STFT)とスペクトログラム
音楽信号は時間変化が重要なため、全体を一度にフーリエ変換するだけでは不十分です。短時間フーリエ変換(STFT)は信号を短いフレームに分け、それぞれに窓関数を掛けてDFTを行うことで時間-周波数表現を得ます。STFTの大きな出力がスペクトログラム(時間軸×周波数軸の強度表示)です。
実務上のポイント:
- 窓関数:矩形、ハン(Hann)、ハミング、ブラックマンなど。窓は主ローブ幅とサイドローブ(リーケージ)の特性を決めます。窓によってピークの幅や漏れ(スペクトルリーケージ)が変わるため、目的に応じて選びます。
- オーバーラップ:フレーム間のオーバーラップ(例:50%、75%)を増やすと時間方向の滑らかさが向上しますが計算量が増えます。
- ゼロパディング:時間領域のフレームにゼロを追加すると周波数領域での補間が得られ、プロットやピーク検出がしやすくなりますが、真の分解能は向上しません。
実際の楽音解析でのよくある応用
スペクトル分析は多様なタスクで使われます。代表的な応用例を挙げます。
- 音高(ピッチ)推定:単音(モノフォニック)では、基音の周波数と倍音列を検出することでピッチを推定します。手法には自相関法、YINアルゴリズム、スペクトルピーク追跡などがあります。楽曲全体のピッチトラッキングにはSTFTやケプストラム(cepstrum)を組み合わせることが多いです。
- 和声分析(コード推定):複数の同時音がある場合、スペクトル上のピークパターンをスペクトルテンプレート(音階上の倍音パターン)と照合してコードを推定します。変換後にテンプレートマッチングや機械学習を使う手法が一般的です。
- 音色解析・楽器識別:音色はスペクトル包絡(スペクトルの滑らかな形)や倍音比、アタック成分に依存します。メル周波数ケプストラム係数(MFCC)は音色特徴量として広く使われ、楽器分類やジャンル分類に有効です。
- オンセット検出・リズム解析:時間方向の急激なスペクトル変化(高周波成分の増加など)を検出することで、ノートの開始(オンセット)や打楽器のアタックを見つけます。位相情報や高周波帯域の差分を用いる手法もあります。
高度な技術と注意点
より深い解析や高精度を求める場合、いくつかの高度な手法と注意点があります。
- スペクトルリーケージと窓の選択:急峻な周波数成分が窓端で切れるとリーケージが生じます。リーケージにより近傍の周波数成分が汚染されるため、適切な窓選択とオーバーラップが重要です。
- 位相情報の活用:多くの可視化は振幅(パワー)情報のみを表示しますが、位相は音の合成や信号再配置(reassignment)で重要です。位相を利用することで、より鋭い時間-周波数定位や位相ベースの分離が可能になります。
- 再割当法(Reassignment)・マルチターパース法:STFTによるスペクトログラムは時間周波数平面でブラーが生じますが、再割当法は各スペクトルエネルギーをより正確な時間・周波数位置に再配置することで可視化のシャープ化を行います。
- 定常成分と非定常成分の分離:ハーモニクス(定常的)と打音(非定常的)を分離する手法(例:HPSS — Harmonic/Percussive Source Separation)はミックスの解析やエフェクト適用に有用です。スペクトルの時間的な連続性や滑らかさを基準に分離します。
- 定常性の仮定と短時間性:STFTは各フレーム内で信号がほぼ定常であることを仮定します。急速に変化する信号ではこの仮定が破られるため、より短い窓や別手法(CQT、Wavelet)を検討します。
定数Q変換(CQT)とウェーブレット変換の活用
音楽解析では高い音程に対して対数的な周波数軸が自然であるため、STFTの等間隔の周波数解像度が最適でない場合があります。定数Q変換(CQT)は周波数ビンの幅を中心周波数に対して一定の比(Q)に保つため、低域で高い周波数分解能、高域で高い時間分解能を実現します。ピアノや和声の解析、旋律解析に向いています。ウェーブレット変換も同様に時間-周波数の可変解像度を提供します。
実装とツール
実際にスペクトル分析を行うためのライブラリやツールは豊富です。代表的なもの:
- Python: NumPy/ SciPy(FFT, STFT)、librosa(STFT、CQT、MFCC、HPSSなど音楽向け機能)、Essentia(MIR向け)、pyroomacoustics。
- MATLAB: Signal Processing Toolbox・Audio Toolbox が強力。学術研究で広く使われます。
- DAW/視覚化ツール: Sonic Visualiser、Audacity、iZotope RX などはスペクトログラム表示と編集機能を持ちます。
実装時の注意点:
- サンプリングレートとウィンドウ長の設計を目的に合わせて行う。
- 窓関数、ゼロパディング、オーバーラップをチューニングして解析品質と計算コストのバランスを取る。
- ピーク検出や追跡は単純な最大値検出だけでなく、サブピクセル補間(パラボリック補間など)を用いると周波数推定精度が向上する。
品質評価と限界
スペクトル分析は強力ですが限界もあります。例えば、多成分が密に重なった場合の分離は困難で、非線形歪みや位相の絡み合いは単純なスペクトル表示だけでは把握できません。また、FFTベースの解析は窓選択の影響を受けるため、結果の解釈には注意が必要です。評価指標としては、周波数推定誤差、分離後の信号対雑音比(SIR/SAR/SAR)、主観的聴感評価などを組み合わせるのが一般的です。
実践的なワークフローの例
以下はメロディ抽出を目的とした典型的なワークフローです。
- 前処理:リサンプリング、ノイズ低減、正規化。
- STFT/CQT取得:目的に応じて窓長・オーバーラップ・変換を選定。
- スペクトル平滑化・ログ振幅変換:dBスケール化やメル/対数周波数への変換で特徴抽出しやすくする。
- ピーク検出と倍音追跡:基音候補の抽出、HPCP(Harmonic Pitch Class Profile)やテンプレート照合。
- 時系列処理:動的プログラミングや確率モデル(HMM、CRF等)で滑らかなピッチトラックを構築。
- 後処理:ノイズ除去、短いスパイクの削除、音高の補正。
まとめ:音楽解析におけるスペクトル分析の位置づけ
スペクトル分析は音楽信号の周波数情報を明らかにし、ピッチ推定、楽器識別、エフェクト設計、ミックス改善、音楽情報検索など多くの応用を可能にします。STFTが汎用的な基盤ですが、目的に応じて窓、変換(CQT、Wavelet)、位相情報や再割当法、機械学習を組み合わせることで精度と実用性を高められます。解析結果の解釈では、解析パラメータや信号の性質(定常性・非定常性)を常に考慮することが重要です。
エバープレイの中古レコード通販ショップ
エバープレイでは中古レコードのオンライン販売を行っております。
是非一度ご覧ください。

また、レコードの宅配買取も行っております。
ダンボールにレコードを詰めて宅配業者を待つだけで簡単にレコードが売れちゃいます。
是非ご利用ください。
https://everplay.jp/delivery
参考文献
- Steven W. Smith, The Scientist and Engineer's Guide to Digital Signal Processing — DSPのオンライン教科書(基本理論と実装に有用)。
- Julius O. Smith III, Spectral Audio Signal Processing (CCRMA) — 音響信号処理の講義資料。
- librosa Documentation — 音楽信号処理ライブラリの公式ドキュメント(STFT/CQT/MFCC等)。
- Serra, J. & Smith, J.O., "Spectral Modeling Synthesis" — スペクトルモデルに関する論文・解説。
- Oppenheim & Schafer, Discrete-Time Signal Processing — 離散時間信号処理の定番教科書(参考として)。


