MPEG-1 Audio Layer I

MPEG-1 ljudlager 1
Förlängning .mp1eller.m1a
MIME -typ audio/mpeg [1] , audio/MPA [2]
Utvecklaren ISO , IEC
Formattyp audio
Standard(er) ISO/IEC 11172-3 [3] ,
ISO/IEC 13818-3 [4]
Hemsida mpeg.chiariglione.org

MPEG-1 Audio Layer I (förkortning MP1 ) är ett av tre förlustformat för ljudkomprimering (nivå 1) som definieras i MPEG-1- standarden [5] . Medan MPEG-1 Audio Layer I stöds av de flesta moderna mediaspelare anses formatet vara föråldrat. Istället används huvudsakligen MP2- och MP3- formaten .

Filer som endast innehåller MP1-ljudinformation använder tillägget .mp1 eller ibland .m1a.

MP1-komprimeringstekniken använder ett relativt enkelt bandkodningsschema med 32 subband.

Layer I (Layer 1) rekommenderas för professionell användning i inspelnings-/ominspelningssystem med hög studiokvalitet med tillräcklig minneskapacitet. Den kännetecknas av låg komplexitet och låg grad av ljuddatareduktion.

MPEG-1 lager I användes också i Digital Compact Cassette som en del av PASC ( Precision Adaptive Sub-band Coding  ) ljudcodec .  På grund av behovet av att överföra en konstant ström av individuella datablock (ramar) till band, använde PASC en extra bit i MPEG-huvudet för att bestämma början av en ram. Bithastigheten är alltid 384 kbps [6] .

Grundläggande parametrar

MPEG-1 Layer I ljudkodning och avkodning

Kodningsmetod

Den ingående digitala ljudsignalen är uppdelad i ramar (ramar), som var och en är kodad och avkodad oberoende av andra ramar. Ramstorleken för Layer I är 384 prover.

Ljudsignalbandet är uppdelat i 32 delband med hjälp av digitala bandpassfilter. Alla delband har samma bredd, vilket beror på samplingshastigheten för insignalen. Efter delning reduceras samplingshastigheten med en faktor 32, så att antalet sampel per ram i varje delband är 12.

Därefter kvantiseras data. Skalfaktorer bestäms preliminärt, vilka beror på signalens maximala värde. I detta fall bestäms skalfaktorn för varje delband i ramen, det vill säga för 12 sampel av delbandssignalen. Före kvantisering delas signalvärdena med lämpliga skalfaktorer.

Därefter utförs datakvantisering i kvantiserings- och kodningsblocket. Komprimeringen av ljudinformation på Layer I-nivån är baserad på en metod som kallas adaptiv bitallokering. Denna metod består i att utföra kvantisering med ett annat antal kvantiseringsbitar för olika frekvensdelband. I detta fall används enhetlig kvantisering. Det totala antalet bitar som allokeras till alla delband i en given ram beror på samplingshastigheten för insignalen och på den givna utmatningsbithastigheten, det vill säga på den erforderliga graden av komprimering av ljudinformationen. Fördelningen av bitar över delband utförs av det psykoakustiska modellblocket .

För att utföra bitdistribution i det psykoakustiska modellblocket analyseras spektrumet för den ursprungliga ljudsignalen (ej uppdelad i delband). För att göra detta utförs en snabb Fouriertransform av sektioner av denna signal i 512 sampel, varefter ljudsignalens effektspektrum och storleken på ljudtrycket i varje frekvensdelband beräknas.

Sedan analyseras de tonala (sinusformade) och icke-tonala komponenterna i ljudsignalen, lokala och globala maskeringströsklar bestäms och signal/mask-förhållanden för alla delband beräknas, baserat på vilka bitarna allokeras till delbanden.

I de delband där ljuddistorsionen orsakad av kvantisering är mindre märkbar för lyssnaren eller är maskerad av en högre signalnivå i andra delband, görs kvantiseringen grövre, det vill säga färre bitar allokeras för dessa delband. För helt maskerade delband tilldelas inga bitar alls. Tack vare detta är det möjligt att avsevärt minska mängden överförd information samtidigt som en tillräckligt hög ljudkvalitet bibehålls.

Avkodning

Data som finns i ramen avkodas i enlighet med deras ordnings- och kodtabeller som finns i avkodarens arbetsprogram. Den avkodade bitfördelningen och skalfaktordata används för att avkoda och avkvantisera ljuddata. Efter avkvantisering multipliceras samplen av delbandssignalerna med motsvarande skalfaktorer.

Efter avkodning och avkvantisering kombineras signalsamplen för alla delband till en utgående digital ljudsignal.

Litteratur

Länkar

Digital ljudkomprimering: psykoakustiska grunder och algoritmer. Yuri Kovalgin

Se även

Anteckningar

  1. ↑ Mediatypen för ljud/mpeg - RFC 3003 (nedlänk) . IETF (november 2000). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. 
  2. MIME-typ Registrering av RTP-nyttolastformat - RFC 3555 (länk ej tillgänglig) . IETF (juli 2003). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. 
  3. ISO/IEC 11172-3:1993 - Informationsteknologi -- Kodning av rörliga bilder och tillhörande ljud för digitala lagringsmedia med upp till cirka 1,5 Mbit/s -- Del 3: Ljud (nedlänk) . ISO (1993). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. 
  4. 1 2 ISO/IEC 13818-3:1995 - Informationsteknologi - Generisk kodning av rörliga bilder och tillhörande ljudinformation - Del 3: Ljud (nedlänk) . ISO (1995). Hämtad 15 mars 2011. Arkiverad från originalet 23 mars 2012. 
  5. ISO/IEC 11172-3 "Kodning av rörliga bilder och tillhörande ljud för digitala lagringsmedia med upp till cirka 1,5 mbit/s. Del 3 Ljud»
  6. Digital kompaktkassett. Vanliga frågor
  7. MPEG Audio Frame Header Arkiverad 8 februari 2015.
  8. ISO/IEC 13818-3 (andra upplagan 1998-04-15) . Hämtad 15 mars 2011. Arkiverad från originalet 8 augusti 2011.