Till startsidan för Jonas Webresurs!

Vad är digital video?

1. Inledning

På den här sidan förklarar jag kortfattat några av de vanligaste begreppen inom digital video eller DV, som man oftast säger. Ämnet blir ganska snart komplicerat och därför har jag försökt att bara ta med det allra viktigaste. Sidan skrev dessutom 2003 så en del information kan ha förändrats.

2. Analog vs digital video

Skillnaden mellan en analog och en digital video är inte alltid så enkel att se eller förklara. I båda fallen använder man en filmkamera för att spela in och band för att lagra filmerna. Men ungefär där slutar också likheterna.

Enkelt uttryckt kan man säga att skillnaden mellan analog och digital video beror på hur informationen i videosignalen hanteras.

Analog signalEn analog signal kan beskrivas som en kontinuerligt varierande vågform. Bilden visar hur det ser ut.

Den röda ytan visar signalens olika variationer över en viss tid. Variationerna kan vara mörker/ljus eller rött/inte-rött eller starkt/svagt ljud.

Om vi tittar närmare på en del av signalen ser vi att den har varierande värden. Det går inte att säga exakt vilket värde som finns innanför den blå cirkeln utan man måste antingen räkna ut ett medelvärde eller ange det med decimaler.

Digital signalJämför vi nu med den digitala motsvarigheten ser vi att vågformen är mycket mer hackig. Det beror på att en digital signal varierar i fasta steg.

Vi kan alltså läsa av de olika värdena innanför den blå cirkeln och få en exakt uppgift.

Fördelen med den digitala signalen är att den just har bestämda värden, vilket gör det enklare att handskas med den. Detta gäller t.ex då man skall sända ut den genom en kabel, ta bort brus eller kopiera den.

En nackdel med en digital signal kan dock vara att en del information kan gå förlorad. Mellan de olika stegen i vågformen saknas ju en mjuk och jämn övergång.

Detta är ett problem så länge man har för låg upplösning, alltså använder för stora steg i signalen. Då blir vågformen alldeles för grov och innehåller för lite information.

I och med at tekniken utvecklas blir informationsbortfallet allt mindre och signalerna allt mer högupplösta.

3. Upplösning och bps

Upplösningen i en bild eller video mäts normalt i pixelvärden, t.ex 320x240 eller 640x480, där det första värdet anger bildens bredd och det andra dess höjd.

Ju högre värdet är desto större är upplösningen och desto bättre är normalt också kvaliteten. Men det är inte bara upplösningen som påverkar kvaliteten. Även bps, antalet bilder per sekund, det som på engelska kallas frame rate, påverkar.

På svenska förkortar man alltså "bilder per sekund" som bps. På engelska blir "frames per second" fps.

Ögat kan inte uppfatta fler än 30 bps. På bio visas filmen som regel med 24 bps. På webben brukar man använda 15 bps för Flash-animationer och webb-TV. Så här snabbt är detta i praktiken:

På webben (15 bps)
På bio (24 bps)
15 bps 24 bps

Grundregeln är att ju fler bildrutor per sekund man använder desto högre blir kvaliteten. Men 24 bildrutor ger alltså en tillräckligt hög bildfrekvens. Vid hög kvalitet ökar också filstorleken avsevärt, vilket jag berättar mer om i avsnittet om komprimering.

4. Radsprång

"Radsprång" på svenska är en översättning av det engelska ordet "interlaced". (En annan översättning är "sammanflätad", som används då man pratar om stillbilder av GIF-typ.)

På en vanlig (analog) TV visas bilden som interlaced. Det innebär att elektronstrålen som sveper längs bildskärmens fosforpunkter först målar raderna 1, 3, 5, 7, osv. Först när alla udda rader på skärmen är "målade" sveper strålen över de jämna raderna, alltså 2, 4, 6, osv.

Anledningen till detta är att äldre TV-skärmar hade sämre fosforpunkter, som slocknade om de inte blev belysta. Använde man då non-interlaced-teknik och ritade upp raderna 1, 2, 3, 4, osv, skulle de översta bildpunkterna ha slocknat när de understa ritades upp. Bilden skulle alltså ha flimrat på ett obehagligt sätt.

Med radsprång kan man fördubbla antalet bildrutor per sekund utan att öka mängden information. Men i gengäld blir bilden lite suddigare, i och med att bara halva bilden ritas upp i taget.

Nya digitala skärmar som används för HDTV (Digital-TV) och för datorbildskärmar, klarar dock non-interlaced-tekniken. Man vinner då också många fördelar, bl.a att bilden blir enklare att beräkna, vilket kostar mindre datorkraft.

5. Analoga format

Det som avses här är överföringsformatet, i datorsammanhang detsamma som filformatet, och inte storleken på skärmen eller liknande.

Det finns två eller tre grundläggande analoga videoformat: NTSC, PAL och Secam. Dessa anger framförallt hur färgåtergivningen skall skötas.

Analoga videokameror spelade in filmen med radsprång. Detta skapade problem, då inte alla började inspelningen på samma rad (udda eller jämna linjer). Det var också svårt att konvertera mellan de olika formaten.

Digitala videokameror spelar dock in hela bildrutor åt gången. Men fortfarande finns mycket material som är analogt inspelat. Då måste man kunna lite om teorin för att kunna hantera materialet på rätt sätt.

Format
Finns i
Antal linjer
Bildrutor/sekund
NTSC USA, Kanada, Japan, Korea, Mexiko
525
29,97
PAL Europa, Australien, Kina, Sydamerika
625
25
SECAM Frankrike, Mellanöstern, Afrika
625
25

I NTSC-systemet ritas varje linje upp c:a 60 gånger per sekund, vilket ger ungefär 30 hela bildrutor varje sekund. I PAL däremot ritas varje linje upp 50 gånger per sekund, vilket ger 25 hela bildrutor.

Detta betyder bl.a att filmerna spelas upp olika snabbt, något som kan påverka en film som exporteras för webben.

Antalet horisontella linjer per bildruta är också olika i de tre formaten. Detta påverkar framförallt kvaliteten på materialet då man konverterar mella nde olika systemen.

NTSC står för "National Television Standards Committee" och skapades 1953. Det är alltså ett gammalt och föråldrat format. Ibland talar man därför om NTSC som "Never The Same Color", eftersom färgerna på skärmen är väldigt beroende av vilka mottagningsförhållandena är.

PAL står för "Phase Alternation Line" och SECAM för "Sequential Couleur avec Memoire ". Alla dessa format kommer senast 2008 att ersättas av det nya digitala formatet DTV.

6. Digitala format

I förra avsnittet pratade jag om analoga utsändningsformat. Digitala motsvarigheter är DTV, som står för "Digital Television".

I Japan gjordes analoga utsändningar av DTV redan 1989, men sedan dess har man börjat provsända digitalt. Det finns några olika tekniker inom DTV: HDTV (High Definition Television) och SDTV (Standard Definition TV).

Det som skiljer dem åt är kvaliteten. HDTV motsvarar ungefär biofilm, medan SDTV är c:a en femtedel så bra. Båda använder MPEG-komprimering; se avsnitt 7.

Rent allmänt erbjuder DTV alltså betydligt bättre kvalitet och kompatibilitet än analoga motsvarigheter. Uppdateringen av en DTV-skärm sker t.ex 60 gånger per sekund, vilket är dubbelt så bra som den analoga TV-bilden.

Men förutom utsändningsformat finns det också några vanliga digitala inspelningsformat:

DV-format
Kvalitet
Lämpliga till
DV25 (MiniDV)
Bra
Hemvideo, webben, CD-ROM, enklare DVD
DVCAM, DVPRO
Bättre
Professionella hemanvändare, DVD
DV50, DV100, DigiBeta
Bäst
Proffsprodukter, DVD, biofilmer

De första digitala inspelningsformaten dök upp under 1994, då standarden DVC (Digital Video Cassette) lanserades. Sedan dess har mycket hänt och händer fortfarande. Schemat ovan kommer troligen att behöva revideras vartannat eller vart tredje år.

MiniDV
Detta är ett format med hög kvalitet (förhållandevis hög upplösning och lite brus). De flesta nya DV-kameror använder denna teknik.

Det finns dock äldre kameror som i stället utnyttjar andra tekniker, t.ex Digital-8, Hi-8 eller Standard-8. (Motsvarande analoga format är VHS och Super-VHS.)

MiniDV kallas ibland för DV25 pga av den komprimering som används. Varje sekund film innehåller nämligen 25 Mbit (megabit) information. Jag berättar mer om det i avsnitt 8 .

DVCAM, DVCPRO
Detta är format som skapats för den professionella konsumentmarknaden. Man spelar in lite annorlunda, jämfört med MiniDV, med större informationsmängd på samma band. DVCAM kör t.ex. bandet 50% snabbare medan bild och ljud är av samma kvalite som DV25. I gengäld får man då alltså inte plats med lika mycket material på ett band som med miniDV.

DV50, DV100
Innebär att filstorleken är 50 respektive 100Mbit per sekund. Givetvis inget för den normala användaren, utan mer för industriellt bruk och proffsmarknaden. Båda används för DTV.

Digital Betacam eller DigiBeta är ett professionellt format för inspelning av bl.a långfilm.

7. 4:3 och 16:9

I den nya TV-världen har man sedan en tid skiljt mellan två olika bildskärmsformat: 4:3 respektive 16:9. Det förra är det s.k "TV-formatet" och det senare brukar kallas "bredbild" eller "wide screen" och motsvarar det format biofilmen har.

Siffrorna 4:3 och 16:9 anger proportionerna för det som visas:

4:3 16:9

De flesta moderna TV-apparater klarar av att visa båda formaten.

8. Komprimering och codec

Man måste komprimera videofilm för att kunna hantera den i datorn eller få plats med den på ett lagringsmedium. Detta kan man enkelt visa genom följande räkneexempel:

(640x480) x 3 x 24 = 22118400

En okomprimerad video med skärmformatet 640x480 pixlar, som är i färg (RGB-systemet utgörs av 8x8x8 bitars färgdjup, som här blir 3 bytes). Dessutom visas filmen med 24 bilder per sekund. Varje sekund okomprimerad film tar alltså upp 22118400 bytes eller 22MB i minnet!

Därför komprimerar man alltid materialet på olika sätt. Vanligt är att man använder komprimeringen ruta för ruta. Detta kallas för intra-frame compression. Då finns det framförallt tre olika sätt att minska filstorleken:

Dra ner på storleken
Man kan gå från 640x480, som är ganska stort, till 320x240.

Minska antalet bilder
15 bilder per sekund är som sagt standarden för Internet-baserad film.

Minimera antalet färger
Intressant nog märker inte ögat när antalet färger minskar. Däremot är ögat väldigt känsligt för ljus. Vi ser alltså om filmen inte är tillräckligt ljus, men inte om den är tillräckligt röd.

Men det går också att dra ner på filstorleken genom att använda andra komprimeringsmetoder:

Inter-frame compression
Sådan innebär att varje ny bildruta jämförs med den föregående. Endast informationen om de ändringar som gjorts sparas därefter. Metoden självklart passar bäst för filmer som inte har så många färger, detaljer och variation.

DV-komprimering innebär alltså att "onödig" information rensas bort vid inspelningen. Standardkomprimeringen ger en dataström av 25 Mbit (megabit) per sekund. Därför kallas denna standard DV25. För att föra över så mycket information till datorn samtidigt krävs FireWire-kabel (IEEE-1394)

Standarderna DV50 och DV100 innebär dels en lägre komprimeringsgrad, men är också filmade i ett större format.

All komprimering sköts av en codec. Ordet är en förkortning av "Compression and Decompression". En codec är en slags matematisk beräkningsmodell (algoritm) som bestämmer hur komprimeringen skall gå till.

Codecar kan finnas inbyggda i hårdvaran eller utgöras av en plugin (tilläggsprogram) som installeras till det program man använder.

Det finns många olika sorters codecar och via hårdvarans eller programmets hjälpfiler kan man hitta mer information. Via tillverkarnas hemsidor brukar man också kunna ladda hem nyare versioner av olika codecar.

9. MPEG

"MPEG" uttalas ämm-pägg och står för "Motion Pictures Expert Group". Denna sammanslutning består av proffs på film och video. De har tagit fram olika standarder för komprimering av film.

Version 2, som går under namnet MPEG-2, är idag den förhärskande komprimeringsmetoden för DVD, satellitsänd TV, musik, m.m. Den kräver en överföringshastighet på ungefär 1 MB per sekund, dvs ungefär 8 Mbit.

MPEG-2 är dock sämre för komprimering då man spelar in och redigerar. Detta beror på att komprimeringen som sker med MPEG-2 kräver ganska avancerade beräkningar och därför tar mycket datorkraft. Därför används MPEG-2 i sista fasen av produktionen, då man skall publicera materialet på en DVD eller en sajt.

Hur komprimeringen går till mer i detalj går jag inte in på här, eftersom det är ett ganska så avancerat ämne.

MPEG-1 hette den tidigare standarden. Den var begränsad till 352x240 pixlar och används fortfarande för enklare produktioner på CD-ROM och video på webben.

Standardformatet för komprimerad musik, MP3, använder MPEG-1-standarden, men endast den del som hanterar ljud.

MPEG-3 utvecklades aldrig till fullo, utan man gick direkt till MPEG-4, alltså version 4. Den används idag i QuickTime och Windows Media, bl.a. för strömmande media (streaming media), trådlösa nätverk och liknande.

På liknande sätt kommer MPEG-5 och MPEG-6 troligtvis inte ut på marknaden. Idag pratar man i stället om MPEG-7. Komprimeringen kommer att vara densamma som i MPEG-4, men man kommer att lägga till möjligheter att lägga in metadata i det komprimerade materialet. Metadata används för indexering och sökning.


Den här sidan är en del av Jonas Webresurs - www.jonasweb.nu - copyright © 1998-2011