圧縮オーディオファイル形式を理解します

The state of the audio nation is at a crossroads. With internet bandwidth increasing, we don't need to data compress audio files as much as before. Joe Albano explores quality vs. size.  

我々はそれについて考えるかどうかに関係なく、毎日それらに耳を傾け、聞きしたい多くの人々はImはMP3ファイルなど、これらのユビキタスデータ圧縮、LO解像度オーディオファイルについて話して、nowadaysofもちろん聞くことを得るオーディオファイルの種類のみあなたがiTunes Storeから入手MP4 / AACS。しかし、音楽やオーディオの生産を行うことに関与している者たちのものは、これらのすべての形式で音質の妥協性質があまりにも認識しています。ロスレス方法はdataFLACとAppleロスレスは、おそらく彼らはせいぜい半分にファイルサイズを削減することができますcodecsbut最もよく知られているすべてのオーディオを保持し、妥協のないオーディオファイルのサイズを小さくするために存在します。ロッシーcodecsMP3、MP4 / AAC、さらに劇的othersreduceファイルサイズのホスト。これらの小さなオーディオファイルは、オーディオの成功ストリーミングやダウンロードの鍵インターネットが通常の(フル品質PCM)オーディオファイルのサイズよりも5から10倍小さい音声ファイルを作るために若いとslowbutた、代奨めのGIVEました。

Fig 1 A chart of the most common audio file formats: Linear PCM, Lossless Codecs, and Lossy Codecs (from the MPV/AskVideo Course Audio Concepts 105: Sound Recording).

図1の最も一般的なオーディオファイル形式のチャート:リニアPCM、ロスレスコーデック、および非可逆コーデック(MPVから/ AskVideoコースオーディオの概念105:録音)。

ヒットを取ります

非可逆データ圧縮技術は、そのかなり小さいサイズを達成するために、音響心理学の原理を利用します。人間の聴覚装置(耳付き

Fig 2 File size comparison of PCM (16 & 24 bit) Lossless (Apple Lossless) and MP3 & MP4 files (at various bitrates.

PCMの図2ファイルサイズの比較(16

しかし、このデータ/サイズの縮小はコストがかかります。ロスレスファイルとは異なり、非可逆フォーマットは単に斬撃SRよりも良い響きのにもかかわらず、すべてのオーディオデータを保持しておらず、

サウンド

どれだけヒットしたオリジナルの、未妥協PCM音声データに正確なMP3やAACSのですか?まあ、それは異なります。 TheresのMP3またはAAC符号化処理を実施する誰も単一の方法は、そのように異なる符号化ソフトウェアは、異なる結果を生成しなくてもよいです。最小のファイルサイズで、通常、ローエンドの重さのいくつかの顕著な損失、および高値のスミアリング、深さと透明感が失われ、場合によっては縮小ステレオイメージをtheresの、音楽(160分の128 KB /秒)に適したものとみなさ。 AACは(私は非可逆形式を使用しなければならないとき、私は、AACSを好む)と同じサイズでMP3よりもこの点で少し良く鳴ります。現在、二重sizes256のKBあるいは320キロバイト/秒のMP3 / AACSを使用することが、そのより一般的。 Appleは(自動的に)購入(とでもうまくアップグレードユーザー古い128キロバイトファイル)をAACS 256キロバイトにiTunes Storeのための標準をアップグレードしました。

私はAskAudioの記事とオーディオクリップが含まれている場合、私は256キロバイトのAACとしてそれをコードします。分離して聞いて、これらは、より小さなMP3ファイルとして不足しているように完全にacceptablenotです。しかし、現在の非可逆ファイルは、(彼らはかつてあったように、または少なくとも)それは、なぜあなたがYouTubeや他のソーシャルメディアにinternetespeciallyに聞くいくつかのストリーミングオーディオはとてもひどい音sitesstillんすべてのほど悪くはありませんか?

さて、問題の大部分は、オーディオをストリーミングするための商用サイトにアップロードされている場合、そのサイトは、多くの場合、非可逆、(おそらく、それらのサーバーの帯域幅を最大にするために)さらに、ファイルサイズが小さくなり、あなたの慎重まで音声を再符号化する、ということです320分の256 kbのaudiofileが悪い昔を思わせる​​金切り声、phaseyのドロドロになっている準備されました。任意償還請求がある場合残念ながら、これに対処することは、面倒なことができます。一部のサイトでは、他の人はあなたが、任意のオーディオ品質のオプションの中に慎重に検討するyoullの必要があるエンジニアやミキサーとしてスタジオのスキルを推進し、より高品質のオーディオyoureのpremiumif $のためのストリームあなたの音楽を促進する、または悪化を楽しむ、あなたに何のオプションを与えませんサイトでは、あなたのトラックを普及するために使用することにしました。

事態

それは非可逆オーディオに来るとき、それは、現在の状況に私たちを取得します。多くのユーザーに、現在利用可能な高い帯域幅を使用すると、私たちは本当にまだすべてで非可逆圧縮が必要なのでしょうか? 256キロバイトのファイルは、元の(CD品質)のPCMバージョンよりも5回までしか小さく、ロスレスコーデックは半分PCMファイルのサイズなので、それは当時と全く同じ大きありえないサイズ違いです。アップルのhasntはまだロスレス時流にジャンプしますが、そのより高い解像度のロスレスバージョンを提供して、オーディオのダウンロードサイトで提供するためのより一般的になってきて(ジェイ-ZS新しいストリーミングサービスはわずかな保険料のために、高解像度のオプションを提供しています)。多くはまだ低速接続で立ち往生しているが、それは非可逆形式の卸売放棄のための時間ではないかもしれないが、最終的には、それらを必要とせず、ロスレスオーディオは(おそらくされます)を引き継ぐ必要があります。

しかし、この潜在的な進行は、他の要因によって複雑になります。何人かの人々は高解像度のオーディオについて話すとき、聞きしたいだけで、聞きしたいではなくても44.1Kなど最高品質(未エンコード)PCM解決ファイル、特にサンプルレートが(批判非可逆と可逆符号化技術との違いを参照していません48K規格)、有利に高いのSR(96K)。 (すべてではないエンジニアがaudiofileで超音波音成分を含んでSRを、向上にtheresのを同じくらいの利益を信じて)24ビットの分解能は、現在、プロのPCMオーディオ用(明らかに、より正確な)受け入れられた標準であるが、SRの問題がより論争です。そして、現在の録音の質に関する議論の多くは、使用を中心/重圧縮の使用オーバーと大声ファイルの探求(悪名高いラウドネス戦争)で、マスタリングに限定します。だから、ロッシー対ロスレスの問題は議論が頻繁に回る作る、すべての標準的な解像度のPCM対ハイレゾPCMの引数を指定してアップごちゃ混ぜ、圧縮苦情をマスターとなっています

それを最大限に活用

そこで、この記事では、アイブ氏は別の時間、別の場所のために、これらの他の問題を残し、唯一の非可逆/可逆符号化問題や規格に焦点を当ててみました。だから、ときに品質が手元の目的のために可能な限り良い、と許容されるものを確認するために、あなたの慎重に細工された録音とミックスの非可逆バージョンを作成し、共有するためにあなたは何を行うことができますがありますか?私はミックスの全体的な治療を聞くために、ミュージシャンのクライアントのためにミックスの(小さな)ファイルを電子メール添付するよう求められた場合たとえば、私はおそらく256K AACまたはMP3 320Kとしてそれをコード化することを躊躇wouldntの。しかし、音質で判断するオーディオマニアジャズ·レーベル、たとえば、にファイルを送信する場合、Idが主張する(そのため、彼らはでしょう!)それはロスレスファイルであることにそれは電子メール忘れるとファイル共有を使用して意味しても、より大きなファイルサイズを扱うことができるサイト。

非可逆ファイルを作成する場合は、使用可能ないくつかのオプションがあることが多いです。ジョイントステレオなどの設定は、(いくつかのステレオファイルにエンコードを改善することができる)と低周波をフィルター(ファイルに強力な低周波エネルギーによるアーチファクトを回避するのに役立つ場合があります)時には、特定のオーディオファイルで最大トリミングすることがある問題が、キーの設定に対応することができ品質とデータratetheビットレートです。 theresの場合は品質のエンコードに時間がかかることがありますオプション、(おそらく無視できる違い、これらの日)が、少なくともあなたはyoureのは、その特定のエンコーダが可能である最高の取得を知っています。それは帯域幅は、これらの日はるかに高いので、ビットレートになると、Idは古い規格(128/160キロバイト)とを避けるため、再度、常に256/320キロバイトratestheファイルサイズダブルスが、そのまだ5日、元のサイズを使用し、

Fig 3 Some options for MP3 and MP4 file creation in Logic (top, middle) and QuickTime Pro 7 (bottom).

図3のいくつかのロジックでMP3やMP4ファイルを作成するためのオプション(上、中)とQuickTime Pro 7の(下)。

youreのファイルを作成するには、スタンドアロンのソフトウェアを使用している場合は、あらかじめエンコーダの数を試してみて、全体的な最高の音質を持つものに落ち着くべきです。 youreのDAWから作業している場合、ほとんどの、今日のデータレートを選択すると、バウンス·ツー·ディスク·プロセスの一部としてMP3またはAACファイルを作成するためのオプションが含まれ、ほとんどのDAWは、高品質の符号化アルゴリズムのライセンスを取得しています。同様に、iTunesやQuickTimeは(Macの場合、あなたはユーティリティフォルダに潜んでいる古いのQuickTime 7のコピーを持っている必要があり、かつ、AAC / MP4(M4Aためにユーザが調整可能エンコード品質のオプションを提供します)オーディオは価値がfilesitd良好な結果を与えることができます少し実験)。言うまでもなく、クリーンで明確に元のファイルは、より多くの可能性がitllその品質のほとんど無傷で知覚符号化処理を生き残るためになります。残念ながら、今日では、あまりにも一般的であり、レベル限界に達し、高濃度圧縮マスター、多くの場合、あまりつぶれ、よりダイナミックなミックス(それらの他の品質の問題は、すべての後に完全分離して存在してはいけない)よりも非可逆形式により乏しい変換します。

要約

限り多くの人々はまだ少ない当時の高帯域幅の接続を持っているし、電子メールサーバがまだ添付ファイルのサイズの上限を、それが少なくともとして短期的には、非可逆オーディオを扱うことがよくいるようです。そして、純粋に技術的な考慮事項のほかに、非可逆オーディオファイルも一緒に育った音楽愛好家や音楽メーカーの世代のための標準となっています。いくつかの研究は、これらのリスナーがあっても完全な品質のPCMにそのわずかに帯域制限、少し押しつぶさ音を好むことを示唆しています! (私はおそらくthatsのfamiliarifのためだけに優先/彼らはより良い音質に慣れる機会を得るとき、theyllが集まってくるのだと思います)。一方で、より積極的に音質に関係している人たちのものはweveがPCM /ロスレスオーディオ可能な限りのbeenexchangeとして高い(320分の256)ビットレートを選択し、最高品質のエンコーダを見つけ、上に保持し、監視の目を保つことができます公衆にあなたの仕事を提示されているすべてのウェブサイト。そして、このareathings内のさまざまな動向に目を保つには良い方向に変更する態勢を整えており、それらの変更は、私たちが話したとしても何が起こってもよいです。

Learn more in Joe Albano's Audio Concepts courses at AskVideo.com

Joe is a musician, engineer, and producer in NYC. Over the years, as a small studio operator and freelance engineer, he's made recordings of all types from music & album production to v/o & post. He's also taught all aspects of recording and music technology at several NY audio schools, and has been writing articles for Recording magaz... Read More

Discussion

Want to join the discussion?

Create an account or login to get started!