Ett smultronställe för Internetblåbär


Digitalt ljud

Det finns två huvudtyper av "digitalt ljud". Den ena kallas MIDI och är i princip digitala noter. Läs mer om MIDI i Musiknets MIDIskola! Den andra typen - inspelat ljud - beskrivs nedan.

Från analogt till digitalt

Som bekant är ljud vågor av förändringar i lufttryck, som en mikrofon kan avbilda som vågor i analoga elektriska signaler. För att omvandla dessa signaler till digitala koder behövs en AD-omvandlare. Sådana sitter i datorernas ljudkort, och i cd-spelarna. Följande avsnitt beskriver vad som sker i en AD-omvandlare.
[bild ljudvåg]
Mikrofon gör analoga elektriska vågor av ljudvågorna

Sampling

För att digitalisera ljud måste man sampla. Det innebär att man ett visst antal gånger per sekund mäter nivån på vågen. Ju tätare samplingar, desto bättre ljud, men också mer data att överföra, och fler beräkningar att göra.
[bild sampling]

Bilden visar vågen under en millisekund. Med 8 samplingar blir samplingsfrekvensen 8kHz.

Kvantisering

Efter samplingen måste varje mätvärde avrundas till närmaste kvantiserinngsnivå - kvantiseras. Ju fler nivåer desto större precision och därmed bättre ljud (mindre kvantiseringsfel), men också mer data att överföra, och fler beräkningar att göra. Siffran under varje mätning anger det kvantiserade värdet (antal ifyllda ytor). Värdet anges både med vanliga siffror och med binära siffror.
[bild kvantisering]
0   4   3   2   4   6   5   2
000 100 011 010 100 110 101 010

Som du ser motsvaras varje sampling av tre bitar (binära siffror). Tre bitar räcker till åtta kvantiseringsnivåer. Normalt kostar man på åtta eller sexton bitar per sampling - det motsvarar 256 respektive 65000 nivåer.

Ljudformat

Raden med ettor och nollor ovan är en digital representation av vår samplade ljudvåg. Eftersom man kan göra digitaliseringen på olika sätt så är det inte självklart att alla ljudprogram kan tolka vår bitström. En grundförutsättning är att den som vill lyssna är överens om samplingsfrekvens och antal bitar per sampling. I praktiken är det ytterligare några val som måste göras likadant vid inspelning som vid uppspelning för att det ska fungera:

Felkorrigering

Det kan hända att någon etta eller nolla tappas bort eller blir fel när bitströmmen sparas på disk eller skickas iväg i en kabel. Därför lägger man ofta in några kontrollbitar med jämna mellanrum i bitströmmen. Kontrollbitarna hjälper uppspelningsprogrammet att upptäcka fel på bitströmmen. Om det finns tillräckligt många kontrollbitar så kan de till och med användas för att reparera fel i bitströmmen!

Komprimering

Ofta har man intresse av att komprimera en bitström, för att den ska få plats på en lagringsskiva eller i en telefonledning. Hur mycket man kan komprimera bitströmmen beror på vad den skall användas till. Accepteras ingen kvalitetsförlust så blir komprimeringsgraden ganska liten.

Ibland, speciellt i telefonisammanhang, är det dock inte så viktigt att allt ljud kommer fram, man är nöjd om språket blir begripligt. Det finns ljudformat som tar hänsyn till detta faktum, och reducerar behovet av bitar genom att använda statistik för hur röster låter. Ett exempel på detta är GSM. En annan fascinerande teknik är den så kallade psykoakustiken. Den används i bland annat MPEG-ljudformatet och innebär att ljud som människan upplever som viktiga får vara kvar, medan andra ljud kastas bort.

Några ljudformat som är vanliga på Internet

Ett ljudformat är en uppsättning av svar på frågorna: Vilken typ av komprimering? Vilken felkorrigering, format på bitström och vilken samplingsfrekvens skall användas? Vissa format ger exakta svar, men många anger ett par alternativ. Då måste de exakta svaren bifogas i början av ljudströmmen.
Namn Fil-tillägg Typisk sampling
(kHz * bitar)
Filstorlek mono 1 minut Överförings- kapacitet * Användnings- område Låter som
WAVE .wav 44,1 * 16 5000 kB 700 kbps cd-rom (PC) CD
AIFF .aif 44,1 * 16 5000 kB 700 kbps cd-rom (Mac) CD
MPEG-ljud .mp2 44,1 * 16 500 kB 70 kbps demo-musik FM-radio
Sun AU .au 8 * 8 480 kB 64 kbps webb-ljud telefon
RealAudio .ra
anpassat för direktsändning
120 kB 16 kbps direktsänd nät-radio AM-radio
GSM .gsm
8 kHz *
anpassat till tal
90 kB 13 kbps direktsänt tal varierar
MIDI .mid - 7 kB 1 kbps
Styr synth likt noter
* Jämför kraven på överföringskapacitet med kapaciteten hos ditt modem (t.ex. 28 kbps) så ser du vilka format som kan spelas upp i direktsändning!


uppdaterad 970113