音楽における周波数分析入門:FFT・スペクトログラム・実践テクニック
周波数分析とは何か — 音楽でなぜ重要か
周波数分析は、音(時間領域の波形)を周波数成分(どの周波数にどれだけのエネルギーがあるか)に分解して可視化・解析する手法です。楽器や声は複数の倍音(部分音)から成り、その構成や時間的変化を理解することで、音色の違い、混ざり具合、定位、マスキング(ある音が別の音を覆い隠す現象)などを理論的に扱えます。録音・ミキシング・マスタリング・音楽情報検索(MIR)・音響研究など、音楽制作と解析の基盤です。
基礎理論:フーリエ変換と離散フーリエ変換(DFT/FFT)
フーリエ変換は任意の時間信号を正弦波の合成として表す数学的道具です。デジタル音声では離散化された信号を扱うため、離散フーリエ変換(DFT)を用い、計算効率化されたアルゴリズムが高速フーリエ変換(FFT)です。
DFTの基本式により、DFTのk番目の周波数ビンが表す周波数は次の式で与えられます:k × fs / N(fsはサンプリング周波数、NはDFT長)。つまり周波数分解能はおおよそ fs / N です。窓長を長く取れば周波数分解能は高くなりますが、時間分解能は下がります(時間・周波数のトレードオフ)。
時間周波数表現:STFTとスペクトログラム
短時間フーリエ変換(STFT)は、信号を短い時間窓に分割して各窓ごとにDFTを計算することで時間変化を追える手法です。STFTを可視化したものがスペクトログラムで、縦軸が周波数、横軸が時間、色・輝度が振幅(または対数振幅)を表します。
STFTの設計で重要な点:
- 窓関数(Hann, Hamming, Blackmanなど):窓形はサイドローブやリーケージ(スペクトル漏れ)を制御する。矩形窓はリーケージが大きい。
- 窓長(長さ)とオーバーラップ:長窓=高周波分解能・低時間分解能、短窓=高時間分解能・低周波分解能。
- ゼロパディング:DFT長を増やして表示上の周波数線を細かく見せる(実際の分解能は変わらない)。
音楽特有の周波数表現:定Q変換(CQT)と対数周波数
音楽は等比(半音)で音程が決まるため、線形周波数軸のFFTは音高解析に必ずしも最適ではありません。定Q変換(CQT: Constant-Q Transform)は各ビンの中心周波数が幾何級数的(等比)に配置され、各ビンの帯域幅が中心周波数に比例(Qが一定)します。これにより半音ごとの解析やピッチ検出、和音解析などが直感的になります。
位相と振幅:見落とされがちな情報
多くの可視化は振幅スペクトルを使いますが、位相情報も重要です。位相は時間領域での波形再構成に必須で、複数トラックの位相干渉(位相差)により音が強調・相殺されることがあります。位相を無視すると逆変換で元の音を完全には復元できません(ただし一部の音色特徴は振幅包絡で表現される場合もあります)。
重要な実務指標と注意点
- サンプリングとナイキスト周波数:サンプリング定理は最高周波数f_maxに対してサンプリング周波数fsが2f_max以上であることを要求します(エイリアシング防止)。一般に44.1kHzは人間可聴帯域をカバーしますが、超高周波の処理やフィルタ設計では注意が必要です。エイリアシングは上位周波成分が折り返して下位域に混入する現象です。
- エネルギーと対数スケール:人間の聴覚は対数的に感度を変えるため、スペクトルの可視化は対数振幅(dB)で行うことが多い。低レベル成分は線形表示で見えにくいため。
- 臨界帯域とマスキング:人間の周波数解像度は周波数によって異なり、臨界帯域(Bark尺度)に基づくマスキング現象はミキシングや音声圧縮(MP3など)の基礎になります。
音楽制作での具体的応用
周波数分析は次のような場面で直接役立ちます。
- イコライジング(EQ):不要な共鳴や周波数の衝突(マスキング)をスペクトルで特定してカット/ブーストする。サブトラクティブEQは混雑した帯域の整理に有効。
- マスキングの発見:ボーカルがギターに埋もれる等はスペクトログラムで確認でき、ハイパス/ローカットやダイナミックEQで対処する。
- 位相とフェーズコヒーレンス:複数マイク録音時に位相ずれが低音を打ち消すことがあるため、位相調整やタイムアライメントが必要。
- ピッチ検出・音高解析:CQTやピッチ追跡アルゴリズム(YIN, pYINなど)を用いてメロディ抽出やスコア生成に利用。
- 音色設計とスペクトル包絡:シンセ音の比較やサンプリング楽器のスペクトル包絡を調整して意図した音色を作る。
- 時間伸縮・ピッチシフト(位相ボコーダー):スペクトルの位相を扱うことで時間伸縮や高品質なピッチシフトが可能。
実践テクニックとチェックリスト
- 分析前に適切なサンプリングレートとビット深度を確認する(クリッピングや量子化ノイズは結果を歪める)。
- 窓長は目的に応じて選ぶ。ピッチ解析なら長め(高周波分解能)、トランジェント解析なら短め(高時間分解能)。
- 窓関数はHannが汎用的。鋭い周波数成分を精密に見る場合はBlackman系、トランジェントを重視するなら短窓+高オーバーラップ。
- ゼロパディングは見た目の滑らかさ向上に使えるが、実効分解能の向上ではないことを理解する。
- スペクトル表示はdB軸(対数)で確認すると聴感に一致しやすい。ピークやRMS表示を使い分ける。
- CQTは音高解析や和音認識に有利。ジャンルや目的に合わせてFFT/STFT/CQTを使い分ける。
よくある誤解と落とし穴
- 「高い解像度=良い分析」ではない。過度に長い窓は時間的変化を見逃す。
- 位相を無視したスペクトラムだけではミックスの問題点が分からないことがある(位相キャンセルなど)。
- ゼロパディングで見える細かなピークが必ずしも実在の成分ではない。ピーク検出時はSNRや隣接ビンの関係を確認する。
参考となるツール
- Spectrum Analyzer(DAW内蔵、またはプラグイン): 視覚的確認に最適。
- iZotope Insight / SPAN(Voxengo): 詳細なスペクトル解析や統計機能。
- Librosa / Essentia: 研究・自動解析に便利なライブラリ(Python)。CQTやピッチ検出実装あり。
- Matlab / Octave: カスタム解析・アルゴリズム検証に有効。
まとめ
周波数分析は音楽制作・解析の強力なツールであり、FFT/STFT/CQTや窓関数、位相、サンプリング理論といった基礎知識を理解することで、より精度の高い判断ができるようになります。目的に応じて時間/周波数の分解能を設計し、ヒューマンリスニング(対数スケール、臨界帯域、マスキング)を意識した表示と処理を行うことが重要です。
エバープレイの中古レコード通販ショップ
エバープレイでは中古レコードのオンライン販売を行っております。
是非一度ご覧ください。

また、レコードの宅配買取も行っております。
ダンボールにレコードを詰めて宅配業者を待つだけで簡単にレコードが売れちゃいます。
是非ご利用ください。
https://everplay.jp/delivery
参考文献
- フーリエ変換 - Wikipedia
- 高速フーリエ変換 (FFT) - Wikipedia
- 短時間フーリエ変換 (STFT) - Wikipedia
- Constant-Q transform - Wikipedia (英語由来の説明あり)
- サンプリング定理(ナイキスト) - Wikipedia
- 臨界帯域(Bark尺度)とマスキング - Wikipedia
- iZotope: What is spectrum analysis? (英語)
- Librosa: Constant-Q transform (英語ドキュメント)
投稿者プロフィール
最新の投稿
ビジネス2025.12.28成果賞与の設計と運用ガイド:導入効果・法務・KPI・実務ノウハウ
ビジネス2025.12.28業績連動報酬の設計と実務ガイド:メリット・課題・導入手順
ビジネス2025.12.28成果連動報酬とは?導入手順・設計ポイント・リスク対策を徹底解説
ビジネス2025.12.28成果給(パフォーマンスベースの報酬)とは:設計・運用・リスク回避までの実務ガイド

