MPEG-1 Audio Layer II

MPEG-1/MPEG-2 ljudlager 2
Förlängning	.mp2
MIME -typ	ljud/mpeg, video/mpeg
Utvecklaren	ISO , IEC
Formattyp	ljud, video, behållare
Utökad från	MUSIKAM
Utvecklad i	MPEG-2
Standard(er)	ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2]

MPEG-1 Audio Layer II (förkortning MP2 , ibland kallad Musicam ) är ett av de tre förlustformat för ljudkomprimering (nivå 2) som definieras i MPEG-1 [ 3] -standarden . Används i digitala DAB-sändningar och den äldre Video CD- standarden som användes för att distribuera filmer på optisk CD på 1990-talet och före den utbredda användningen av DVD .

MPEG-1 Audio Layer 2-kodaren utvecklades från MUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) audiocodec utvecklad av CCETT , Philips och IRT 1989 som en del av EUREKA 147 europeiska studier. mellanstatlig utveckling för digitala sändningssystem för fasta, bärbara och mobila mottagare (grundad 1987). Huvudparametrarna för MPEG-1 Audio ärvdes från MUSICAM, inklusive filterbanken, tidsdomänbehandling, ljudbildstorlek, etc. Efter ytterligare förbättringar användes dock inte MUSICAM-algoritmen i den slutliga versionen av MPEG-1 Layer II standard [4] .

Grundläggande parametrar

MPEG-1 Audio Layer II definieras i ISO/IEC 11172-3 (MPEG-1 del 3)
- Samplingshastighet: 32, 44,1 och 48 kHz
- Bithastigheter: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 och 384 kbps.
Formattillägget introducerades i MPEG-2 Audio Layer II och definierades i ISO/IEC 13818-3 (MPEG-2 del 3) [5] [6]
- ytterligare samplingshastigheter: 16, 22,05 och 24 kHz
- ytterligare bithastigheter: 8, 16, 24, 40 och 144 kbps, för 5.1-format - cirka 1 Mbps.
- flerkanalsstöd - upp till 5 fulla kanaler och en kanal med lågfrekventa effekter.
Variabel bithastighet (VBR) stöds

MPEG-1 Layer II ljudkodning och avkodning

Kodningsmetod

Den ingående digitala ljudsignalen är uppdelad i ramar (ramar), som var och en är kodad och avkodad oberoende av andra ramar. Ramstorleken för Layer II är 1152 sampel.

Ljudsignalbandet är uppdelat i 32 delband med hjälp av digitala bandpassfilter. Alla delband har samma bredd, vilket beror på samplingshastigheten för insignalen. Efter delning reduceras samplingsfrekvensen med en faktor 32, så att antalet sampel per ram i varje delband är 36.

Därefter kvantiseras data. Skalfaktorer bestäms preliminärt, vilka beror på signalens maximala värde. I detta fall bestäms skalfaktorn för grupper om 12 avläsningar i varje delområde, och faktorn kan vara gemensam för två eller tre grupper. Således bestäms upp till tre skalfaktorer för varje delband i en ram. Före kvantisering delas signalvärdena med lämpliga skalfaktorer.

Därefter utförs datakvantisering i kvantiserings- och kodningsblocket. Komprimeringen av ljudinformation på Layer II-nivån är baserad på en metod som kallas adaptiv bitallokering. Denna metod består i att utföra kvantisering med ett annat antal kvantiseringsbitar för olika frekvensdelband. I detta fall används enhetlig kvantisering. Det totala antalet bitar som allokeras till alla delband i en given ram beror på samplingshastigheten för insignalen och på den givna utmatningsbithastigheten, det vill säga på den erforderliga graden av komprimering av ljudinformationen. Fördelningen av bitar över delband utförs av det psykoakustiska modellblocket .

Efter kvantisering kodas mottagna data. De kvantiserade signalsamplen i varje delband kombineras med tre, och de resulterande bitsekvenserna kodas med användning av kodtabeller med variabel längd. Dessutom kodas data om fördelningen av bitar över delband och data om skalningsfaktorer med hjälp av motsvarande tabeller.

För att utföra fördelningen av bitar i det psykoakustiska modellblocket analyseras spektrumet för den ursprungliga ljudsignalen (ej uppdelad i delband). För att göra detta utförs en snabb Fouriertransform av sektioner av denna signal i 1024 räkningar, varefter ljudsignalens effektspektrum och storleken på ljudtrycket i varje frekvensdelband beräknas.

Sedan analyseras de tonala (sinusformade) och icke-tonala komponenterna i ljudsignalen, lokala och globala maskeringströsklar bestäms och signal/mask-förhållanden för alla delband beräknas, baserat på vilka bitarna allokeras till delbanden.

I de delband där ljuddistorsionen orsakad av kvantisering är mindre märkbar för lyssnaren eller är maskerad av en högre signalnivå i andra delband, görs kvantiseringen grövre, det vill säga färre bitar allokeras för dessa delband. För helt maskerade delband tilldelas inga bitar alls. Tack vare detta är det möjligt att avsevärt minska mängden överförd information samtidigt som en tillräckligt hög ljudkvalitet bibehålls.

Avkodning

Data som finns i ramen avkodas i enlighet med deras ordnings- och kodtabeller som finns i avkodarens arbetsprogram. Den avkodade bitfördelningen och skalfaktordata används för att avkoda och avkvantisera ljuddata. Efter avkvantisering multipliceras samplen av delbandssignalerna med motsvarande skalfaktorer.

Efter avkodning och avkvantisering kombineras signalsamplen för alla delband till en utgående digital ljudsignal.

Anteckningar

↑ ISO/IEC 11172-3:1993 - Informationsteknologi -- Kodning av rörliga bilder och tillhörande ljud för digitala lagringsmedia med upp till cirka 1,5 Mbit/s -- Del 3: Ljud (nedlänk) . ISO (1993). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. (obestämd)
↑ ISO/IEC 13818-3:1995 - Informationsteknologi - Generisk kodning av rörliga bilder och tillhörande ljudinformation - Del 3: Ljud (nedlänk) . ISO (1995). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. (obestämd)
↑ ISO/IEC 11172-3:1993 Informationsteknologi — Kodning av rörliga bilder och tillhörande ljud för digitala lagringsmedia med upp till cirka 1,5 Mbit/s — Del 3: Ljud . Hämtad 14 mars 2011. Arkiverad från originalet 23 mars 2012. (obestämd)
↑ Fakta om MPEG-komprimering Arkiverad 8 maj 2001.
↑ MPEG-2 Audio Layer I/II . Hämtad 14 mars 2011. Arkiverad från originalet 30 april 2010. (obestämd)
↑ MPEG Audio Frame Header Arkiverad 8 februari 2015.

Litteratur

Smirnov A.V. Grundläggande om digital-tv: Lärobok - M .: Hotline-Telecom, 2001. - 224 s.: ill.

Länkar

Digital ljudkomprimering: psykoakustiska grunder och algoritmer. Yuri Kovalgin

Se även

MPEG-1
- MPEG-1 Audio Layer I
- MPEG-1 Layer III (MP3)
MPEG-2
- AAC (MPEG-2 del 7) - uppdaterad 1999 och ingår i MPEG-4 del 3
MPEG-4
- AAC (MPEG-4 del 3)

MPEG (Moving Picture Experts Group)
MPEG-1 2 3 fyra 7 21 A B C D E V M U
MPEG-1-sektioner	Del 3: Ljud ( Layer I Lager II lager III )
MPEG-2-sektioner	Del 1: System ( Trafikflöde programflöde ) Del 2: Video (H.262) Del 3: Ljud ( Layer I Lager II Lager III Flerkanalig MPEG ) Del 6: DSM CC Del 7: AAC
MPEG-4-sektioner	Del 2: Video Del 3: HE-AAC Del 6: DMIF Del 10: H.264 Del 11: Beskrivning av scenen Del 12: ISO-mediafilformat Del 14: MP4-filformat Del 17: Strömmande textformat Del 20: Lightweight Scene Playback Application (LASeR)
MPEG-7 sektioner	Del 2: Definition Description Language (DDL)
MPEG-21-sektioner	Delarna 2, 3 och 9: Digitalt objekt Del 5: Rättighetsbeskrivning Språk (REL)
MPEG-D-sektioner	Del 1: MPEG Spatial Audio

Ljudkomprimering
Codecs	ATRAC Dolby Digital /AC3 DTS Musepack Opus TwinVQ (VQF) Vorbis WMA
Tal/röst	AMBE iLBC IMBE iSAC Nellymoser QCELP RTAudio SILKE Siren Speex SVOPC Sant tal
Förlust mindre	Apple förlust FLAC La Monkey's Audio OptimFROG TAK True Audio/ TTA wav pack WMA förlustfri
Standarder och format	AAC AMR G. 711 718 719 722 723 723,1 726 728 729 729,1 729A HE-AAC MLP MPEG-1 ljud Lager I Lager II Lager III MT9 RealMedia SHN
Digitala ljudformat Jämförelse av digitala ljudformat

mediebehållare
Video/ljud	3gp ASF AVI Bink DMF DPX EVO FLV MP4 MPEG MPEG-PS MPEG-TS MXF Matroska (MKV) Ogg Media Ogg Snabb tid RIFF RealMedia Smacker VOB WebM WMV kompression jämförelse
Audio	AIFF APA A.U. DSD DXD FLAC MLP MP3 SHN WAV WMA kompression jämförelse
musik	MIDI ( KAR ) tracker musik
Raster	DNG FPX FLIF HEIF ICER ICO ILBM JBIG2 JBIG JPEG XR (HD-foto) JPEG / JP2 / JPEG-LS MNG EXR PCX PNG PSD PNM Rå TIFF TGA WBMP WebP XCF PGF Animerad: APNG , GIF Förlustfri: BMP Inklusive förlustkompression: BPG
Vektor	SWF AI CDR EPS PS SVG VRML EMF WMF X3D XPS 3D: 3DS Animerad: SVG
Komplex	CGM DJVu PDF