ピッチシフト完全ガイド:原理・技術・実践的な使い方と注意点
ピッチシフトとは何か
ピッチシフト(pitch shift)は、音声や楽器録音の音高(周波数)を上げ下げする処理を指します。単純な再生速度の変更によるものから、高度なアルゴリズムで時間長を維持しながら音高のみを変えるものまで含まれ、レコーディング、ライブ演奏、サウンドデザイン、ポストプロダクションなど幅広い用途で用いられます。
音楽制作においては、キー変更、ハーモナイザー、コーラスの作成、ボーカル補正や特殊効果などで頻繁に利用されます。技術的には周波数軸の操作、時間領域の処理、スペクトル領域での変換など複数のアプローチがあります。
基礎理論:音高と周波数の関係
音高は音の主な周波数(基音)に対応します。平均律での半音(1セミトーン)は周波数比が2^(1/12)(約1.05946)です。n半音の周波数比は次の式で表せます:2^(n/12)。また、1オクターブは1200セント(1セミトーン=100セント)です。極端なピッチ変更は倍音構造やフォルマント(声の共鳴ピーク)を大きく変化させ、結果として不自然さが生じます。
ピッチシフトの主要なアルゴリズム
ピッチシフトにはいくつかの代表的な手法があり、それぞれ利点と欠点があります。
- 単純な再生速度変更(リサンプリング):オーディオを単純にサンプリングレートを変えて再生すると音高が変わりますが、同時に再生時間も変化します。古いテープやオルガン的な効果には有効ですが、時間長を保持できないため多用途には向きません。
- 時間領域手法(PSOLA, SOLA, WSOLAなど):音声を短いフレーム(ピッチ同期や固定長)に分割し、オーバーラップ・アド(重ね合わせ)して再構成する技術です。PSOLA(Pitch Synchronous Overlap and Add)は主に音声合成やボーカル処理で広く用いられ、フォルマントの自然さを比較的保つことができます。SOLA/WSOLAは一般的なタイムストレッチ技術として優れた移行特性を持ちます。
- 周波数領域手法(フェーズボコーダー):短時間フーリエ変換(STFT)でスペクトルに変換し、位相を追跡しながら周波数軸を伸縮します。時間長を変えずにピッチ変更が可能で、複雑なスペクトル処理が行えますが、時間解像度や位相の扱いによって音がうねったり、トランジェントがぼやけることがあります。
- グラニュラー合成(Granular):短い粒(グレイン)単位で音を切り出して再配置・伸縮・ピッチ変更を行う方法です。柔軟で極端な効果やテクスチャ作成に向いていますが、粒の重なりや窓関数次第で粒立ちやノイズが生じます。
- スペクトル再合成(完全スペクトル処理):音をスペクトル成分に分解(ハーモニック/残余に分離)して個別に処理し、再合成する手法です。フォルマントやハーモニクスを細かく扱えるため、非常に自然な結果を出せますが計算量が大きく、実装は複雑です。
フォルマント(formant)と自然さの保持
人間の声ではフォルマント(声道の共鳴ピーク)が声の特性を決めます。単純に周波数をスケールするとフォルマントも同じ比率で移動し、結果として性別や話し方が変わってしまうことがあります。音楽用途ではフォルマント保持(formant preservation)機能を持つピッチシフターがよく使われ、声の「大きさ」や「色」を保ちながらピッチだけを変えるよう設計されています。
フォルマント処理は位相処理やスペクトルシフト、または専用のフォルマント補正アルゴリズムに基づきます。高級な商用プラグインやツール(後述)では、フォルマントとピッチを個別に制御できるものが多く、より自然な補正が可能です。
ピッチ検出と追跡の重要性
多くのピッチシフト処理は入力音のピッチ(基音)を正確に検出・追跡する必要があります。ピッチ検出アルゴリズムには自己相関(autocorrelation)、YINアルゴリズム、ケプストラム法、FFTベースの方法などがあります。誤検出があるとハーモニクスの位置を間違え、シフト音が不自然になったり、ノイズやアーティファクトが生じる原因となります。
実用上のメリットと用途
音楽制作での具体的な用途は以下の通りです。
- キー変更・トランスポーズ:トラック全体や個別パートのキーを変える。生演奏を伴わないトラックの即時調整に有効。
- ボーカル補正(Pitch Correction):ピッチを微調整して音程を整える。リアルタイムのオートチューン効果から、詳細な手作業補正まで様々。
- ハーモナイザー:入力に対して複数のピッチシフトを重ね、ハーモニーを生成する。ライブでのコーラス効果に多用。
- サウンドデザイン:変調、ロボット化、異世界音声など特殊効果作成。
- サンプリングとサウンドマッチング:異なる曲のキーを合わせる、サンプルのピッチを変更して楽曲に合わせる。
よくあるアーティファクトとその対処法
ピッチシフト処理ではいくつかの典型的なアーティファクトが発生します。
- フェージング/うねり(phasing):位相の不連続や位相追跡のずれにより周期的なうねりが生じる。フェーズボコーダーの設定や窓サイズ、ホップサイズの調整で緩和可能。
- トランジェントのぼけ:短いアタック音が伸びたりぼやけたりする。トランジェント検出と分離でトランジェント成分を保護すると改善する。
- フォルマントの不自然な変化:声の自然さが損なわれる。フォルマント保持オプションやスペクトル分解による補正が必要。
- ジッパーノイズ/ステップノイズ:ピッチ検出の切り替わりやパラメータ自動化で音が段差的に変わる。滑らかな補間やラグを持たせることで軽減。
実践的な使い方のポイント
制作現場での実用的なコツを挙げます。
- まず原音のキーを確認する(耳またはキー検出ツール)。正しいターゲットに合わせることで不自然さを減らせます。
- 微調整はセント単位で行う(例:±10〜50セント)ことが多く、大きなシフトはフォルマント補正を有効にする。
- リアルタイム処理ではレイテンシーに注意。レイテンシーが高いと演奏感に影響します。プラグインやハードウェアの遅延を確認する。
- ハーモナイザー用途では、入力のピッチ追跡が安定しないと不安定な和音が生成されるため、安定したピッチ検出が重要。
- オートメーションでピッチを動かす場合はスムージングを使い、意図しないステップを防ぐ。
代表的なプラグイン・ツール・ライブラリ
市販の高品質ツールやオープンソースのライブラリが多数存在します。用途や予算に合わせて選択します。
- Antares Auto-Tune(商用)— リアルタイムピッチ補正で広く普及。クリニカルな補正から派手なオートチューン効果まで対応。
- Celemony Melodyne(商用)— ノート単位で波形を解析・編集できる高精度ツール。自然な補正やタイミング補正に強み。
- Eventide H3000/H9(ハードウェア/プラグイン)— 高度なピッチシフトやハーモナイゼーション機能を備える。
- Waves SoundShifter(商用)— タイムストレッチとピッチシフトを高品質に行うプラグイン。
- Rubber Band Library(オープンソース)— 高品質のタイムストレッチ/ピッチシフトライブラリ。
- SoX / SoundTouch(オープンソース)— 簡便なコマンドラインやライブラリでのピッチ変更が可能。
最新技術動向:ニューラルネットワークとスペクトル手法
近年は機械学習・ニューラルネットワークを用いた音声変換やピッチ変換の研究が活発です。ニューラルボコーダー(WaveNet系やWaveRNN、HiFi-GAN等)と組み合わせることで、より自然なフォルマント制御や音色の維持が可能になりつつあります。AutoVCや声質変換(voice conversion)の研究分野では、ピッチ・フォルマント・声色を分離して処理するアプローチが提案されていますが、実用化には計算コストやリアルタイム化の課題があります。
実験と評価の方法
ピッチシフトの品質評価は主観評価(リスナーによる評価)と客観評価(SNR、スペクトル類似度、フォルマント誤差など)で行います。実際の楽曲でテストする際は、ソロの楽器・混合音源・ボーカルなど複数の素材で検証すると現場でのパフォーマンスが把握しやすくなります。
まとめ
ピッチシフトは単純な効果から高度な音声処理まで幅広い手法を含む領域です。用途に応じて適切なアルゴリズム(リサンプリング、PSOLA、フェーズボコーダー、グラニュラー、スペクトル再合成など)を選び、フォルマント保持やトランジェント保護、ピッチ検出の安定化などの注意点を押さえることで、自然で意図した効果を得られます。近年のニューラル技術は更なる自然さをもたらす一方で、リアルタイム化や計算資源の制約という現実課題も抱えています。
エバープレイの中古レコード通販ショップ
エバープレイでは中古レコードのオンライン販売を行っております。
是非一度ご覧ください。

また、レコードの宅配買取も行っております。
ダンボールにレコードを詰めて宅配業者を待つだけで簡単にレコードが売れちゃいます。
是非ご利用ください。
https://everplay.jp/delivery
参考文献
- Pitch shifting — Wikipedia
- Phase vocoder — Wikipedia
- PSOLA — Wikipedia
- YIN (algorithm) — Wikipedia
- Antares Auto-Tune
- Celemony Melodyne
- Rubber Band Library
- SoX - Sound eXchange
- Eventide Audio


