Formaty Audio

7
Antropologia dźwięku. dr Agata Stanisz IEiAK UAM 1 Porównanie jakości zapisywanego dźwięku w najbardziej popularnych standardach Poniższa tabela zawiera porównanie często stosownych formatów zapisu audio. Większość opisanych tu formatów ma wiele opcji, które silnie wpływają na ostateczne parametru zapisu dźwięku. Poza tym, nawet dla tych samych parametrów zapisu istotny jest dodatkowo sam kodek, którym dokonywano kompresji (szczególnie istotne to jest w przypadku formatu mp3, oferującego dużą ilość kodeków o różnych własnościach). Poza tym należy pamiętać, że na jakość zapisywanego dźwięku ma wpływ także sposób jego nagrywania. Różne programy mają różne własności pod tym względem. W tabeli poniżej użyte zostały różne kolory dla formatów z związanych z bezstratnymi formatami zapisu (dźwięk daje się odtworzyć dokładnie w tej postaci jak został zapisany), i formatami stratnymi (czyli w jakimś, choćby nawet niezauważalnym przez człowieka, stopniu zubażającymi materiał źródłowy). Standard zapisu / twórca, właściciel praw Jakość dźwięku / parametry / typowy nośnik Uwagi formaty bez kompresji wav, AIFF, jakość zależna od parametrów pliku - od bardzo niskiej, do doskonałej od kilku KHz, do prawie 100 kHz Głębokość bitowa - od 8 do 24 bitów. Formaty te są zbiorem standardów o różnych częstotliwościach próbkowania i głębokości bitowej. Możliwości w tym zakresie uzależnione od klasy karty muzycznej i jej oprogramowania, oraz od programu do obróbki dźwięku. Standardowo zapisywany jest sygnał mono, lub stereo. Plik wav nagrany w studiu nagraniowym stanowi wzorcowe źródło sygnału. Uwaga: Standardowe pliki wav nie kompresowane, jednak jest możliwe zapisanie dźwięku skompresowanego (np. mp3) z rozszerzeniem wav i będzie on prawidłowo rozpoznany przez system Windows. .wav (wave form audio format): format plików dźwiękowych stworzony przez Microsoft oraz IBM. Mimo że pliki WAVE mogą być zapisane przy użyciu dowolnych

Transcript of Formaty Audio

Page 1: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

1

Porównanie jakości zapisywanego dźwięku w najbardziej popularnych standardach

Poniższa tabela zawiera porównanie często stosownych formatów zapisu audio. Większość opisanych tu formatów ma wiele opcji, które silnie wpływają na ostateczne parametru zapisu dźwięku. Poza tym, nawet dla tych samych parametrów zapisu istotny jest dodatkowo sam kodek, którym dokonywano kompresji (szczególnie istotne to jest w przypadku formatu mp3, oferującego dużą ilość kodeków o różnych własnościach).

Poza tym należy pamiętać, że na jakość zapisywanego dźwięku ma wpływ także sposób jego nagrywania. Różne programy mają różne własności pod tym względem.

W tabeli poniżej użyte zostały różne kolory dla formatów z związanych z bezstratnymi formatami zapisu (dźwięk daje się odtworzyć dokładnie w tej postaci jak został zapisany), i formatami stratnymi (czyli w jakimś, choćby nawet niezauważalnym przez człowieka, stopniu zubażającymi materiał źródłowy).

Standard zapisu / twórca, właściciel praw

Jakość dźwięku / parametry / typowy nośnik

Uwagi

formaty bez kompresji wav, AIFF,

jakość zależna od parametrów pliku - od bardzo niskiej, do doskonałej od kilku KHz, do prawie 100 kHz Głębokość bitowa - od 8 do 24 bitów.

Formaty te są zbiorem standardów o różnych częstotliwościach próbkowania i głębokości bitowej. Możliwości w tym zakresie uzależnione są od klasy karty muzycznej i jej oprogramowania, oraz od programu do obróbki dźwięku. Standardowo zapisywany jest sygnał mono, lub stereo. Plik wav nagrany w studiu nagraniowym stanowi wzorcowe źródło sygnału. Uwaga: Standardowe pliki wav nie są kompresowane, jednak jest możliwe zapisanie dźwięku skompresowanego (np. mp3) z rozszerzeniem wav i będzie on prawidłowo rozpoznany przez system Windows. .wav (wave form audio format): format plików dźwiękowych stworzony przez Microsoft oraz IBM. Mimo że pliki WAVE mogą być zapisane przy użyciu dowolnych

Page 2: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

2

kodeków audio, zazwyczaj stosuje się nieskompresowany format PCM, który powoduje, że pliki zajmują dużo miejsca). Inną wadą formatu jest ograniczenie wielkości pliku do 4 GB, ze względu na 32-bitowe zmienne. Format WAV został częściowo wyparty przez formaty kompresji stratnej. Mimo to, dzięki swojej prostocie, nadal znajduje szerokie zastosowania. Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach audio takich jak odtwarzacze i cyfrowe dyktafony. .aiff (Audio Interchange File Format): Dane audio zapisane są jako nieskompresowany PCM w Big endian. Format jest wykorzystywany głównie przez Apple na komputerach Macintosh. Macintohowy dpowiednik formatu wav. pcm (Pulse Code Modulation): najpopularniejsza metoda reprezentacji sygnału analogowego w systemach cyfrowych. Używana jest w telekomunikacji, w cyfrowej obróbce sygnału (np. w procesorach dźwięku), do przetwarzania obrazu, do zapisu na płytach CD (CD-Audio) i w wielu zastosowaniach przemysłowych. Dźwięk w formacie PCM może być zapisywany z różną częstotliwością próbkowania, najczęściej jest to 8 kHz (niektóre standardy telefonii), 44,1 kHz (płyty CD-Audio), oraz różną rozdzielczością, najczęściej 8, 16, 20 lub 24 bitów na próbkę, może reprezentować 1 kanał (dźwięk monofoniczny), 2 kanały (stereofonia dwukanałowa) lub więcej (stereofonia dookólna). Reprezentacja dźwięku próbkowana z częstotliwością 44,1 kHz i rozdzielczością 16 bitów na próbkę jest uważana za bardzo wierną

Page 3: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

3

swemu oryginałowi, ponieważ pokrywa cały zakres pasma częstotliwości słyszalnych przez człowieka oraz prawie cały zakres rozpiętości dynamicznej słyszalnych dźwięków.

formaty kompresji bezstratnej

APE, FLAC, WavPack i inne

Zestaw kilku formatów o stosunkowo słabym stopniu kompresji. Za to zapewniają oryginalną (bez jakichkolwiek strat) jakość dźwięku i, mimo wszystko, zmniejszenie rozmiaru plików (średnio zmniejszają pliki ok. 2 - krotnie). Są użyteczne do archiwizowania dźwięku. .ape (Monkey's Audio): APE to bezstranna kompresja plików muzycznych. Do kodowania i dekodowania najlepiej uzywać monkey's audio.exe. Uzywany przez użytkowników Windowsa, rzadziej Linuxa. Jest to kodek. Pozwala zmniejszyć wielkość plików od 40 do 50%. Ponieważ wykorzystana metoda kompresji jest bezstratna (w przeciwieństwie do np. formatu MP3) przy pomocy odpowiednich programów pliki w formacie Monkey's Audio można przekonwertować do plików WAV odpowiadających oryginałowi. .flac (Free Lossless Audio Codec): format bezstratnej kompresji dźwięku z rodziny kodeków Ogg. Używany przez opensource-owców (np. Linux). W przeciwieństwie do stratnych kodeków dźwięku takich jak Vorbis, MP3 i AAC, kodek FLAC nie usuwa żadnych danych ze strumienia audio, dzięki czemu po dekompresji otrzymujemy dźwięk identyczny z pierwowzorem. Format FLAC jest obecnie obsługiwany przez większość oprogramowania służącego do edycji i odtwarzania dźwięku (czasami

Page 4: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

4

wymagana jest odpowiednia wtyczka).

WavPack: darmowy, format bezstratnej kompresji dźwięku, oparty na zasadach otwartego oprogramowania. Pliki zawierające dźwięk w tym formacie mają rozszerzenie .wv

płyta audio CD

bardzo dobra / 44,1kHz, 16 bitów bez kompresji / 12 cm płyta CD

aktualnie wzorcowe źródło dla większości słuchaczy

CD-Audio, Audio-CD, CD-DA ( Compact Disc Digital Audio): standard cyfrowego zapisu dźwięku na płycie kompaktowej, wykorzystujący do tego celu kodowanie PCM o częstotliwości próbkowania 44,1 kHz i rozdzielczości 16 bitów na próbkę. Pierwsza płyta kompaktowa CD-DA pojawiła się na rynku w 1982. Była ona wypromowana pod naciskiem przemysłu fonograficznego. Trzy lata później, w 1985 nośnik przystosowano dla potrzeb PC i stał się on najbardziej popularnym uniwersalnym medium, które - jak na owe czasy - miało dosyć dużą pojemność 636 MB. Pierwotnym przeznaczeniem płyt CD-DA było przechowywanie muzyki.

mp3

jakość bardzo dobra, dobra, lub niska (zależna od stopnia kompresji) 44,1 kHz (także 48 kHz) 16 bitów, kompresja stratna.

/różne nośniki cyfrowe - dysk

.mp3 (MPEG-1/2 Audio Layer-3):Standard ten opiera się na identycznych zasadach jak pozostałe formaty kompresji stratnej - np. ATRAC, WMA, OGG.

Jest już dosyć stary, a ponieważ większość klasycznych mp3-jek jest kompresowana przy "bitrejcie" 128 kpbs, to nie oferuje naprawdę wysokiej jakości dźwięku. Audiofile raczej wystrzegają się tak zapisanych

Page 5: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

5

twardy, pamięć flash

plików; choć jak nie ma lepszego źródła, to może być i to (byle kompresowane przynajmniej na 192 kbps). Format mp3 został opracowany w Instytucie Fraunhoffera w Niemczech i jest chroniony prawami autorskimi.

mp3 PRO

podobnie jak mp3

.mp3PRO: stanowi ulepszenie starego mp3 polegające głównie na zwiększeniu wydajności kodowania dla małych plików. Standard ten zapewnia też ogólnie lepsze upakowanie danych i jakość dźwięku osiąganą przy tym samym strumieniu bitów. Zapewnia on około dwukrotnie efektywniejszą kompresję dźwięku, w porównaniu ze zwykłym MP3, a jednocześnie pozwala na zachowanie wyższej jakości słyszalnej.

AAC Advanced Audio Coding

(Apple)

doskonała, bardzo dobra, dobra, lub niska (w zależności od stopnia kompresji) / od 8 kHz (8 bitów) - mono, do 96 kHz, 16 bit wielokanałowo / dowolne nośniki cyfrowe (podobne jak mp3)

.aac (Advanced Audio Coding): jest stosowany jako format zapisu dźwięku w wielu różnych mediach - telewizji cyfrowej (formaty MPEG, MPEG2 MPEG4), plikach audio sklepu internetowego ITunes (współpracujących z odtwarzaczem IPod), w telefonach komórkowych z opcją odtwarzania dźwięku (np. część modeli firmy Nokia) i innych. Rozszerzenie format AAC o nazwie AAC plus zapewnia jakość na poziomie CD audio już przy 48 kbps, a przy 32 kbps jakość dźwięku jest wciąż bardzo dobra. 128 kbps pozwala na przesłanie dźwięku wielokanałowego 5.1. Ogólnie format AAC określa się jako następcę mp3 z racji na bardzo dobrą efektywność kompresji.

ATRAC format stosowany w minidyskach i innych odtwarzaczach Sony

bardzo dobra lub dobra - w zależności od stopnia

.atrac (Adaptive TRansform Acoustic Coding): Jest kilka wersji ATRAC-a (jest to stale rozwijany i doskonalony standard) ostatnią wersją (rok 2005)

Page 6: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

6

kompresji / 44,1 kHz 16 bitów - kompresja stratna / płyty (w kasetce) magnetooptyczne do odtwarzaczy minidisc, lub pliki przesyłane Internetem.

jest ATRAC 3 plus, który zapewnia kilka stopni kompresji, co powoduje, że jakość muzyki zapisanej w tym formacie może być różna w zależności od upakowania danych. Ogólnie jednak można powiedzieć, że jeżeli nie upieramy się aby zastosować maksymalną kompresję w celu upakowania bardzo wielu utworów na jednym krążku, to możemy uzyskać jakość dźwięku praktycznie nie odróżnialną od jakości płyty CD, która to stanowi jakość jest bazową dla formatu ATRAC.

WMA

doskonała, bardzo dobra, dobra, lub niska (w zależności od stopnia kompresji) / od 8 kHz (8 bitów) - mono, do 96 kHz, 24 bit wielokanałowo / dowolne nośniki cyfrowe (podobne jak mp3)

.wma (Windows Media Audio): w najnowszych wersjach kompresuje dane znacznie lepiej niż mp3. Jest to jak na razie jedyny z popularnych formatów z kompresją, który posiada opcję zapisu dźwięku próbkowanego z częstotliwością 96 KHz / 24-bit (w wersji WMA PRO). Ma on także możliwość zapisu dźwięku wielokanałowego. Ogólniejszy standard "Windows Media" (WMA jest częścią audio tego zestawu formatów o wspólnej nazwie "Windows Media") pozwala na kompresję zarówno audio, jak i video, w tym zapis video wysokiej rozdzielczości (HDTV). Posiada jako opcję bezstratny format zapisu dźwięku.

Page 7: Formaty Audio

Antropologia dźwięku. dr Agata Stanisz IEiAK UAM

7

OGG

(Vorbis) (freeware, licencja Open Source)

bardzo dobra, dobra, lub niska (zależna od stopnia kompresji) / 44,1 kHz 16 bitów - kompresja stratna / dowolne nośniki cyfrowe (podobne jak mp3)

.ogg: format kontenera strumieni danych, opracowany stworzony by wspierać inicjatywy związane z rozwojem wolnego oprogramowania do kodowania i dekodowania multimediów. Często spotykany zapis wielkimi literami „OGG” jest nieprawidłowy. Jest to także nazwa rodziny kodeków, co powoduje częste nieporozumienia: np. film zapisany w kontenerze AVI może zawierać strumień dźwięku Vorbis, a w kontenerze Ogg może znajdować się strumień dźwięku w formacie MP3 i obraz kodowany jako DivX/XviD.

Kontener Ogg może zawierać wiele multipleksowanych strumieni dźwięku, obrazu i napisów. Zgodnie ze specyfikacją pliki audio zawierające muzykę mają rozszerzenie .oga, pliki wideo rozszerzenie .ogv, a aplikacje zawarte w tym kontenerze rozszerzenie .ogx. Dla kontenera zawierającego tylko dźwięk w formacie Vorbis używa się rozszerzenia .ogg.

Vorbis: Vorbis to stratny kodek dźwięku z rodziny Ogg. Bardzo często używany jest w połączeniu z kontenerem Ogg i nosi wtedy nazwę Ogg Vorbis, często błędnie zapisywaną tylko jako Ogg, czy nawet jako OGG. Ogg Vorbis potrafi obsłużyć do 255 kanałów i ponad 16-bitowy dźwięk w zakresie 6-48 kHz. Rozszerzenie plików Ogg Vorbis to .ogg lub .oga.