MPEG-1/MPEG-2 ljudlager 2 | |
---|---|
Förlängning | .mp2 |
MIME -typ | ljud/mpeg, video/mpeg |
Utvecklaren | ISO , IEC |
Formattyp | ljud, video, behållare |
Utökad från | MUSIKAM |
Utvecklad i | MPEG-2 |
Standard(er) |
ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2] |
MPEG-1 Audio Layer II (förkortning MP2 , ibland kallad Musicam ) är ett av de tre förlustformat för ljudkomprimering (nivå 2) som definieras i MPEG-1 [ 3] -standarden . Används i digitala DAB-sändningar och den äldre Video CD- standarden som användes för att distribuera filmer på optisk CD på 1990-talet och före den utbredda användningen av DVD .
MPEG-1 Audio Layer 2-kodaren utvecklades från MUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) audiocodec utvecklad av CCETT , Philips och IRT 1989 som en del av EUREKA 147 europeiska studier. mellanstatlig utveckling för digitala sändningssystem för fasta, bärbara och mobila mottagare (grundad 1987). Huvudparametrarna för MPEG-1 Audio ärvdes från MUSICAM, inklusive filterbanken, tidsdomänbehandling, ljudbildstorlek, etc. Efter ytterligare förbättringar användes dock inte MUSICAM-algoritmen i den slutliga versionen av MPEG-1 Layer II standard [4] .
Den ingående digitala ljudsignalen är uppdelad i ramar (ramar), som var och en är kodad och avkodad oberoende av andra ramar. Ramstorleken för Layer II är 1152 sampel.
Ljudsignalbandet är uppdelat i 32 delband med hjälp av digitala bandpassfilter. Alla delband har samma bredd, vilket beror på samplingshastigheten för insignalen. Efter delning reduceras samplingsfrekvensen med en faktor 32, så att antalet sampel per ram i varje delband är 36.
Därefter kvantiseras data. Skalfaktorer bestäms preliminärt, vilka beror på signalens maximala värde. I detta fall bestäms skalfaktorn för grupper om 12 avläsningar i varje delområde, och faktorn kan vara gemensam för två eller tre grupper. Således bestäms upp till tre skalfaktorer för varje delband i en ram. Före kvantisering delas signalvärdena med lämpliga skalfaktorer.
Därefter utförs datakvantisering i kvantiserings- och kodningsblocket. Komprimeringen av ljudinformation på Layer II-nivån är baserad på en metod som kallas adaptiv bitallokering. Denna metod består i att utföra kvantisering med ett annat antal kvantiseringsbitar för olika frekvensdelband. I detta fall används enhetlig kvantisering. Det totala antalet bitar som allokeras till alla delband i en given ram beror på samplingshastigheten för insignalen och på den givna utmatningsbithastigheten, det vill säga på den erforderliga graden av komprimering av ljudinformationen. Fördelningen av bitar över delband utförs av det psykoakustiska modellblocket .
Efter kvantisering kodas mottagna data. De kvantiserade signalsamplen i varje delband kombineras med tre, och de resulterande bitsekvenserna kodas med användning av kodtabeller med variabel längd. Dessutom kodas data om fördelningen av bitar över delband och data om skalningsfaktorer med hjälp av motsvarande tabeller.
För att utföra fördelningen av bitar i det psykoakustiska modellblocket analyseras spektrumet för den ursprungliga ljudsignalen (ej uppdelad i delband). För att göra detta utförs en snabb Fouriertransform av sektioner av denna signal i 1024 räkningar, varefter ljudsignalens effektspektrum och storleken på ljudtrycket i varje frekvensdelband beräknas.
Sedan analyseras de tonala (sinusformade) och icke-tonala komponenterna i ljudsignalen, lokala och globala maskeringströsklar bestäms och signal/mask-förhållanden för alla delband beräknas, baserat på vilka bitarna allokeras till delbanden.
I de delband där ljuddistorsionen orsakad av kvantisering är mindre märkbar för lyssnaren eller är maskerad av en högre signalnivå i andra delband, görs kvantiseringen grövre, det vill säga färre bitar allokeras för dessa delband. För helt maskerade delband tilldelas inga bitar alls. Tack vare detta är det möjligt att avsevärt minska mängden överförd information samtidigt som en tillräckligt hög ljudkvalitet bibehålls.
Data som finns i ramen avkodas i enlighet med deras ordnings- och kodtabeller som finns i avkodarens arbetsprogram. Den avkodade bitfördelningen och skalfaktordata används för att avkoda och avkvantisera ljuddata. Efter avkvantisering multipliceras samplen av delbandssignalerna med motsvarande skalfaktorer.
Efter avkodning och avkvantisering kombineras signalsamplen för alla delband till en utgående digital ljudsignal.
Digital ljudkomprimering: psykoakustiska grunder och algoritmer. Yuri Kovalgin
MPEG (Moving Picture Experts Group) | |
---|---|
MPEG-1-sektioner | |
MPEG-2-sektioner |
|
MPEG-4-sektioner |
|
MPEG-7 sektioner |
|
MPEG-21-sektioner |
|
MPEG-D-sektioner |
|
Ljudkomprimering | |
---|---|
Codecs | |
Tal/röst | |
Förlust mindre |
|
Standarder och format | |
mediebehållare | |
---|---|
Video/ljud | |
Audio | |
musik |
|
Raster | |
Vektor | |
Komplex |