2.1 Lossy
Lossy compressie wordt vooral voor digitale formaten gebruikt zoals beeld en geluid. Aangezien geluid bestaat uit analoge golven, kunnen sommige stukken van de golf weggehaald worden. De mens kan namelijk maar van 20Hz tot 20000Hz horen, daarom kan alles wat er boven of onder zit verwijderd worden. Als er bij Lossy-compressie data wordt weggehaald is het niet meer omkeerbaar, want er worden letterlijk stukjes data verwijderd. Door Lossy compressie te gebruiken zijn er zelfs compressies van meer dan 99% mogelijk.
2.2 Lossless
Bij een Lossless compressie is het uitgepakte bestand (het originele bestand) een exacte kopie van het oorspronkelijke bestand. Dit is bijvoorbeeld belangrijk bij tekstdocumenten en databasebestanden, want daar hoort de tekst steeds hetzelfde te zijn. Een goed voorbeeld hiervan is morsecode. Bij morsecode worden de vaak voorkomende letters gerepresenteerd door een kortere code dan de minder vaak voorkomende letters. Hierdoor zal de totale lengte van de tekst korter worden. Huffmancodering, wat later in deze scriptie besproken wordt, maakt gebruik van deze methode.
3. Algoritmes
In dit hoofdstuk zijn verschillende compressiealgoritmes te vinden. Dit om een indruk te krijgen van hoe compressie precies werkt. Om deze reden wordt er ook alleen stil gestaan bij (een deel van) de werkwijze van deze algoritmes.
3.1 Compressie van gewone data (tekst)
3.1.1 RUN-LENGTH ENCODING
Run-Length encoding (ofwel RLE) is eigenlijk heel simpel; dit algoritme vervangt een opeenvolging van dezelfde tekens door het aantal keer dat het teken voorkomt met daarachter het teken zelf. RLE is effectief wanneer er veel lange opeenvolgingen voorkomen in een bestand. Wanneer er weinig tot geen opeenvolgingen van tekens voorkomen zal het bestand tot maximaal twee keer groter worden. Dit komt doordat wanneer een teken één keer voorkomt het gecomprimeerd zal worden tot het getal één, met daarachter het teken (dit is dus twee keer zo lang dan voor het comprimeren).
Tabel 1: Voorbeeld van RLE.
Voor compressie: C C C X X K P P P P P P M M M J J J J
Na compressie: 3 C 2 X 1 K 6 P 3 M 4 J
3.1.2 BURROWS-WHEELERTRANSFORMATIE
De Burrows-Wheelertransformatie is eigenlijk geen compressie algoritme, maar een andere manier van het ordenen van de tekens. Het bestand zal zelfs groter worden, wanneer alleen deze techniek is uitgevoerd. Deze transformatie zorgt ervoor dat bijvoorbeeld RLE effectiever kan worden uitgevoerd. De manier waarop BWT werkt is heel simpel.
Werkwijze:
Stap 1: schrijf een woord op.
Stap 2: schrijf het woord nog eens op, maar verplaats de eerste letter naar de achterkant van het woord.
Stap 3: neem het woord van stap 2 en herhaal deze stap. Herhaal dit tot dat de laatste letter vooraan staat.
Stap 4: sorteer de woorden op alfabetische volgorde.
Stap 5: alle laatste letters, gevolgd door het nummer waar het woord van stap 1 staat, vormen de output.
Voorbeeld:
Stap 1: Ananas
Tabel 2: Stap 2 en 3 van het voorbeeld van BWT.
1 A N A N A S
2 N A N A S A
3 A N A S A N
4 N A S A N A
5 A S A N A N
6 S A N A N A
Tabel 3: Stap 4 van het voorbeeld van BWT.
1 A N A N A S
2 A N A S A N
3 A S A N A N
4 N A N A S A
5 N A S A N A
6 S A N A N A
Stap 5: SNNAAA 4
3.1.3 HUFFMANCODERING
‘Het principe van Huffmancodering is eenvoudig. Van een reeks symbolen worden de veel voorkomende symbolen weergegeven door een kortere code, dan de weinig voorkomende. Zo kan de hele reeks op een kortere manier gecodeerd worden.’
Laat je de tekst hierboven op een standaard manier (ASCII-codering) coderen, dan ontstaat er de volgende code:
01001000 01100101 01110100 00100000 01110000 01110010 01101001 01101110 01100011 01101001 01110000 01100101 00100000 01110110 01100001 01101110 00100000 01001000 01110101 01100110 01100110 01101101 01100001 01101110 01100011 01101111 01100100 01100101 01110010 01101001 01101110 01100111 00100000 01101001 01110011 00100000 01100101 01100101 01101110 01110110 01101111 01110101 01100100 01101001 01100111 00101110 00100000 01010110 01100001 01101110 00100000 01100101 01100101 01101110 00100000 01110010 01100101 01100101 01101011 01110011 00100000 01110011 01111001 01101101 01100010 01101111 01101100 01100101 01101110 00100000 01110111 01101111 01110010 01100100 01100101 01101110 00100000 01100100 01100101 00100000 01110110 01100101 01100101 01101100 00100000 01110110 01101111 01101111 01110010 01101011 01101111 01101101 01100101 01101110 01100100 01100101 00100000 01110011 01111001 01101101 01100010 01101111 01101100 01100101 01101110 00100000 01110111 01100101 01100101 01110010 01100111 01100101 01100111 01100101 01110110 01100101 01101110 00100000 01100100 01101111 01101111 01110010 00100000 01100101 01100101 01101110 00100000 01101011 01101111 01110010 01110100 01100101 01110010 01100101 00100000 01100011 01101111 01100100 01100101 00101100 00100000 01100100 01100001 01101110 00100000 01100100 01100101 00100000 01110111 01100101 01101001 01101110 01101001 01100111 00100000 01110110 01101111 01101111 01110010 01101011 01101111 01101101 01100101 01101110 01100100 01100101 00101110 00100000 01011010 01101111 00100000 01101011 01100001 01101110 00100000 01100100 01100101 00100000 01101000 01100101 01101100 01100101 00100000 01110010 01100101 01100101 01101011 01110011 00100000 01101111 01110000 00100000 01100101 01100101 01101110 00100000 01101011 01101111 01110010 01110100 01100101 01110010 01100101 00100000 01101101 01100001 01101110 01101001 01100101 01110010 00100000 01100111 01100101 01100011 01101111 01100100 01100101 01100101 01110010 01100100 00100000 01110111 01101111 01110010 01100100 01100101 01101110 00101110
Deze code bestaat uit 1824 bits, maar dit kan door de Huffman codering toe te passen veel kleiner.
Om de Huffman codering te kunnen gebruiken moeten er eerst enkelen stappen worden verricht (zie bijlage 4):
1) Maak een schema met alle voorkomende tekens (inclusief leestekens). Noteer hoe vaak elk teken voorkomt.
2) Maak een boomdiagram:
A) Koppel de twee symbolen met de kleinste frequentie in een boomdiagram tot een gecombineerd symbool met als frequentie de som van de twee afzonderlijke frequenties.
Voorbeeld: De Y(2) en de DOT (3) worden samen de som van de frequenties en dus 5.
B) Voer de vorige twee stappen uit tot er één enkel symbool overblijft.
Bovenstaand is uit te voeren met programma’s op het internet (zie bijlage 3 voor een voorbeeld).
3) Met behulp van het boomdiagram is het nu mogelijk om de tekens een code te geven. Hierbij begint men bovenaan en volgt de ‘takken’ van het diagram naar beneden.
00 in dit boomdiagram representeert bijvoorbeeld een E, dit is 6 bits minder dan de 8 bits die het normaal is zijn het er nu maar 2 (per E). Dat scheelt natuurlijk al redelijk veel.
Door de tekst te comprimeren/coderen doormiddel van de verkregen codes uit het boomdiagram is de volgende code ontstaan:
011000 00 011100 110 011001 1011 10101 1111 101001 10101 011001 00 110 10010 01101 1111 110 011000 0111011 1010001 1010001 01011 01101 1111 101001 1110 1000 00 1011 10101 1111 01010 110 10101 01001 110 00 00 1111 10010 1110 0111011 1000 10101 01010 010001 110 10010 01101 1111 110 00 00 1111 110 1011 00 00 01111 01001 110 01001 010000 01011 0111010 1110 100110 00 1111 110 100111 1110 1011 1000 00 1111 110 1000 00 110 10010 00 00 100110 110 10010 1110 1110 1011 01111 1110 01011 00 1111 1000 00 110 01001 010000 01011 0111010 1110 100110 00 1111 110 100111 00 00 1011 01010 00 01010 00 10010 00 1111 110 1000 1110 1110 1011 110 00 00 1111 110 01111 1110 1011 011100 00 1011 00 110 101001 1110 1000 00 10100000 110 1000 01101 1111 110 1000 00 110 100111 00 10101 1111 10101 01010 110 10010 1110 1110 1011 01111 1110 01011 00 1111 1000 00 010001 110 10100001 1110 110 01111 01101 1111 110 1000 00 110 011000 00 100110 00 110 1011 00 00 01111 01001 110 1110 011001 110 00 00 1111 110 01111 1110 1011 011100 00 1011 00 110 01011 01101 1111 10101 00 1011 110 01010 00 101001 1110 1000 00 00 1011 1000 110 100111 1110 1011 1000 00 1111 010001
Deze code bestaat uit 911 bits, dit is plusminus de helft van het aantal bits dat verkregen wordt wanneer men de tekst in ASCII codeert.
3.2 Compressie van andere types data
3.2.1 COMPRESSIE VAN AUDIO
Een voorbeeld van een techniek van audio compressie is het verwijderen van redundantie. Dit levert op dat alleen de relevante informatie wordt opgeslagen. Dit gebeurt door bijvoorbeeld gebruik te maken van maskeringen, de niet waarneembare toon wordt dan verwijderd.
Bij maskeringen wordt er zowel gewerkt in het tijd-domein als in het frequentie domein. In het tijd-domein zijn vervormingen vlak voor of na een ‘hard’ signaal toegepast. De mens zal de zachtere toon voor of na de hardere toon niet horen. Deze toon wordt dan ook verwijderd. In het frequentie domein zullen de geluiden die te hoog of te laag zijn voor het menselijk gehoor worden verwijderd.
Maar het kan zo zijn dat de kwaliteit van comprimeerde audio erg slecht wordt. Er kunnen bijvoorbeeld onvoorspelbare variaties in volume of ongewenste bijgeluiden ontstaan. Dit komt door harmonische vervorming, wat inhoudt dat de geluidsgolf niet meer vloeiend doorloop, maar abrupt wordt afgebroken en vervolgens (bij een andere amplitude) weer verder gaat.
Voorbeelden van audiocompressie-algoritmes zijn: MP3, WMA, ATRAC, MT9.
In figuur 2 is een voorbeeld weergegeven van een proefje waarbij een WAV-bestand is gecomprimeerd tot een MP3-bestand. Er is duidelijk te zien dat de audiogolf van het WAV-bestand (de bovenste twee golven) veel meer ruimte inneemt dan de golf van het MP3-bestand (de onderste twee golven).
Figuur 2: Voorbeeld van audio compressie.
3.2.2 COMPRESSIE VAN AFBEELDINGEN
Een voorbeeld van beeldcompressie is de methodiek die plaatsvindt wanneer men een afbeelding opslaat als .jp(e)g. Bij deze methodiek wordt de afbeelding verdeeld in zogenoemde macroblocks. Aan elke pixel wordt normaliter een kleurwaarde toegevoegd (zoals weergegeven figuur 4, de tabel onderin in het midden). Te zien dat het macroblock na de compressie veel minder waardes bevat (figuur 4, tabel rechtsonder). Er is dus succesvolle compressie toegepast. De waardes in de gecomprimeerde tabel heten DCT coëfficiënten, deze volgen door de waardes van de middelste tabel onderin in te vullen in de compressieformule van JPEG:
Figuur 3: Compressieformule JPEG.
Dit is echter niet de gehele methode die JPEG gebruikt om te zorgen dat de afbeeldingen minder ruimte in beslag nemen. De rest is niet van belang voor deze scriptie, omdat dit hoofdstuk alleen het doel heeft om te laten zien dat het comprimeren van data mogelijk is.
3.2.3 COMPRESSIE VAN VIDEO
In deze scriptie wordt interframe compressie besproken als voorbeeld van video compressie. Video’s bestaan uit opeengestapelde afbeeldingen (=frames). Interframe compressie verdeeld de videoframes in verschillende soorten; I-frames, P-frames en B-frames. I-frames, ook wel key frames genoemd vormen het eerste en het laatste frame van een reeks frames waarbij een groot deel van het frame gelijk blijft. De P-frames bevatten alleen het deel van het frame dat veranderd ten opzichte van het vorige. Deze zijn dus minder groot dan I-frames, waaruit een niet gecomprimeerde video bestaat. B-frames bevatten delen van P-frames die op een andere plaats zitten dan in het vorige frame. Denk bijvoorbeeld aan een zwaaiende hand, de hand blijft hetzelfde, maar de plaats veranderd constant. Ook voor B-frames geld dat ze kleiner zijn dan I-frames. Wanneer men al deze frames stapelt tot een filmpje zal het volume kleiner zijn dan wanneer men dat doet met het origineel (allemaal I-frames).
Voorbeeld:
Situatie: een niet gecomprimeerd filmpje met een resolutie van 1920X1080 pixels, van 30 frames per seconde, met een lengte van 5 minuten.
1920X1080=2073600 pixels per frame
2073600X30=62208000 pixels per seconde
1 pixel wordt gerepresenteerd door 3 bytes
62208000X24=186624000 bytes per seconde
186624000X300=55987200000 bytes totaal (+/- 52GB)
Normaliter duurt het erg lang om een filmpje met deze grootte over het internet te versturen. Om deze reden is videocompressie in het leven geroepen.
4. Bestandstypes
In dit hoofdstuk worden de verschillende bestandstypes besproken die gebruikt worden in deze scriptie. Er is gekozen voor het bestandstype TXT, omdat dit bestandstype geen gebruik maakt van ingebouwde compressie (in tegenstelling tot een Word-bestand (.docx)). Verder is er gekozen voor de meest gebuikte bestandstypes.
4.1 TXT
Een tekstbestand is een van de soorten computerbestanden dat is gestructureerd als een reeks regels van elektronische tekst. Een tekstbestand wordt opgeslagen als gegevens in een computerbestandsysteem. Het einde van een tekstbestand wordt vaak aangegeven door een of meerdere speciale tekens genaamd end-of-file markeringen, wat na de laatste regel in een tekstbestand wordt geplaatst. Vanwege de eenvoud van tekstbestanden worden ze vaak gebruikt voor het opslaan van informatie. Daarnaast, wanneer datacorruptie voorkomt in een tekstbestand is het vaak makkelijker om te herstellen en de resterende inhoud verder te verwerken. Een nadeel van tekstbestanden is dat ze meestal een lage entropie hebben, wat betekent dat de informatie meer opslagruimte inneemt dan nodig is. Een eenvoudig tekstbestand heeft geen extra metadata nodig om de lezer bij te staan bij het interpreteren en kan daarom ook helemaal geen gegevens bevatten, wat een geval van nul-bytebestand is.
4.2 MP3
MPEG-1 Layer 3 (ofwel MP3) is een manier om geluid te comprimeren en is daarmee een broncoderingtechniek. MP3 is een MPEG standaard wat uitgevonden is in 1992, maar wordt pas vaak gebruikt sinds 1994. MPEG staat voor Moving Picture Experts Group. De muziekbestand versie van MP3 wordt mp3 genoemd. Het comprimeren van geluid houdt in dat je een audiobestand zo klein mogelijk probeert te maken zonder dat de kwaliteit achteruit gaat, dat is namelijk handig als je maar een beperkte opslag heb. Bij het comprimeren van geluid worden er delen van de golven verwijderd die de mens niet kan horen, aangezien de mens maar tussen de 20Hz en 20000Hz kunnen horen. Alles wat er onder of boven zit, kan worden weggehaald en daardoor wordt het bestand minder groot.
Figuur 6: Een voorbeeld van Lossy compressie van audio.
In het blauw is het origineel te zien, het oranje gedeelte is wat overblijft na de compressie. Twee methodes om audio te comprimeren zijn Lossy en Lossless.
4.3 MP4
MPEG-4 (ofwel MP4) is een manier om digitale audio en video te comprimeren. MPEG staat voor Moving Picure Experts Group, vernoemd naar de groep die het ontwikkeld hebben. Het was eind 1998 voor het eerst ontwikkeld en is een standaard voor audio- en video coderingsformaat. MPEG-4, of MP4 bestanden zijn videobestanden en ze worden vaak gebruikt voor compressie van videodata dat normaalgesproken te groot zou zijn om te laden. Doordat video’s veel ruimte innemen, moet het gecomprimeerd worden voordat het op het internet kan worden geplaatst, dat kan in zowel lossy als lossless compressie.
4.4 JPEG
JPEG is een veelgebruikte methode voor lossy compressie van digitale afbeeldingen, met name afbeeldingen die worden gemaakt door digitale camera’s. De mate van compressie kan worden aangepast, waardoor je kan kiezen tussen opslaggrootte of beeldkwaliteit. Daarnaast bereikt JPEG ook een compressie van 10:1, zonder dat de beeldkwaliteit heel erg achteruit gaat.
5. Onderzoek
5.1 De onderzoeksvraag
Heeft het comprimeren van één bestand, door middel van een bestandscompressor, een significant effect op de grootte van het bestand?
5.2 Hypothese
Het comprimeren van één bestand door middel van een bestandscompressor heeft geen significant effect op de grote van het bestand.
5.3 Materiaal
Eén computer met de volgende specificaties:
• Intel® Core™ i7 5500U CPU @ 2.40 GHz 2.40GHz
• 8,00 GB RAM-geheugen
• 64-bit operating system, x64-based processor
• 129,49 GB SSD (gebruikte schijf)
• Windows 10 Education
5.4 Methode
De methode voor dit onderzoek bestaat uit drie delen; het kiezen van de compressiemethodes, het installeren van de benodigde materialen en het uitvoeren van de proef.
5.4.1 KIEZEN VAN DE COMPRESSIEMETHODES
Kies om te beginnen willekeurig een x aantal compressiemethodes. Deze zijn op internet in overvloed te vinden. Het is niet van belang dat de methodes iets gemeen hebben.
5.4.2 INSTALLEREN VAN DE BENODIGDE MATERIALEN
Om bestanden te comprimeren met de gekozen methodes zijn er twee onderdelen nodig: de bestanden en software die de methodes ondersteunt. Test bestanden zijn goed te vinden op het internet. Download testbestanden in verschillende groottes van de volgende extensies: .txt, .mp3, .mp4 en .jp(e)g. Voor de meeste compressiemethodes zijn meerdere programma’s te verkrijgen. De keuze hieruit is niet van belang, zolang het programma maar consistent gebruikt wordt. Installeer de gekozen programma’s op één computer. Voor de proef is het noodzakelijk dat zoveel mogelijk externe factoren geëlimineerd zijn. Zorg ervoor dat de computer zo stationair mogelijk werkt. Dit kan men bekijken in het programma taakbeheer onder de kop prestaties (wanneer de optie ‘meer details’ is ingeschakeld). Verander eveneens niets aan de instellingen van de software. Dit alles om een zo objectief mogelijk onderzoek te verkrijgen.
5.4.3 DE PROEF
Start een van de geïnstalleerde bestandscompressors op. Open in dit programma de locatie waar de testbestanden zich bevinden. Comprimeer de testbestanden afzonderlijk van elkaar met de van te voren bepaalde methode. Schrijf het type bestand (de extensie), de grootte voor het comprimeren en de grootte na het comprimeren op in een tabel.
5.5 Resultaten
5.5.1 KIEZEN VAN DE COMPRESSIEMETHODES
Zip, Alz en Arc (zie bijlage 2)
5.5.2 INSTALLEREN VAN DE BENODIGDE MATERIALEN
Gebruikte groottes: 5mb, 10mb, 15mb, 20mb en 25mb.
5.5.3 DE PROEF
Tabel 4: Resultatentabel onderzoek.
Extensie: Grootte: Grootte na compressie (Zip): Grootte na compressie (Alz): Grootte na compressie (Arc):
Tekst (.txt): 5mb (5120 kB) 1260 kB 1498 kB 16 kB
10mb (10240 kB) 2517 kB 2993 kB 16 kB
15mb (15360 kB) 3775 kB 4490 kB 16 kB
20mb (20480 kB) 5032 kB 5984 kB 16 kB
25mb (25600 kB) 6289 kB 7479 kB 16 kB
Audio (.mp3): 5mb (5169 kB) 5147 kB 5153 kB 5165 kB
10mb (10336 kB) 10293 kB 10306 kB 10329 kB
15mb (14834 kB) 14570 kB 14633 kB 14448 kB
20mb (20467 kB) 20151 kB 20214 kB 19962 kB
25mb (25673 kB) 19317 kB 19234 kB 15925 kB
Video (.mp4): 5mb (5121 kB) 5098 kB 5102 kB 5098 kB
10mb (10297 kB) 10226 kB 10238 kB 10200 kB
15mb (15463 kB) 15285 kB 15303 kB 15343 kB
20mb (20550 kB) 20424 kB 20451 kB 20352 kB
25mb (25678 kB) 25388 kB 25421 kB 25493 kB
Afbeeldingen (.jpg): 5mb (5123 kB) 5113 kB 5114 kB 5149 kB
10mb (9937 kB) 9839 kB 9844 kB 9812 kB
15mb (15355 kB) 15 314 kB 15311 kB 15232 kB
20mb (19844 KB) 19643 kB 19632 kB 19236 kB
25mb (26564 kB) 26111 kB 26152 kB 25902 kB
Resultaten in grafieken:
6. Conclusie
Uit het onderzoek is gebleken dat het comprimeren van afbeeldingen, audio- en videobestanden niet veel oplevert wanneer het gaat om een significante verkleining. Dit komt doordat er al compressie is ingebouwd in de bestandstypes zelf. Echter geldt dit niet voor tekstbestanden (.txt). De hypothese is dus voor een overgroot deel bevestigd.
In de toekomst zal het gebruik van bestandscompressors nog verder afnemen. De reden hiervoor is dat bestandscompressors zullen worden vervangen door de (steeds betere) compressie ingebouwd in de bestandstypes zelf.
7. Bronnen
• Henzen, M. & De Vries, S. (2017). Bestandscompressie (Module: Multimedia). Geraadpleegd op 4 januari 2018.
• Murray, J. & Van Ryper, W. (1996). Encyclopedia of Graphics File Formats (2e ed.). Sebastopol, Verenigde Staten: O’Reilly & Associates, inc.
• Barnwal, A. (2012, 6 november). Greedy Algorithms | Set 3 (Huffman Coding). Geraadpleegd op 16 december 2017, van https://www.geeksforgeeks.org/greedy-algorithms-set-3-huffman-coding/#comment-1016418384
• Everlearn. (z.j.). Videocodecs voor beginnende video-editors [Blogpost]. Geraadpleegd op 16 december 2017, van https://www.everlearn.nl/videocodecs-uitgelegd/
• James H. Armistead (November 26, 2014) C2 the Power of Plain Text. Geraadpleegd op 18 december 2017, van http://wiki.c2.com/?PowerOfPlainText
• Rob Koenen. (4 januari 2001) Intellectual Property Management and Protection in MPEG Standards. geraadpleegd op 27 december 2017, van https://www.w3.org/2000/12/drm-ws/pp/koenen.pdf
Bijlages
Bijlage 1: Verklarende woordenlijst
Tabel 5: Verklarende woordenlijst.
Begrip/term: Definitie/verklaring:
.alz Extensie van de compressiemethode ALZip, ontworpen door ESTsoft.
.arc Extensie van de compressiemethode ARC, ontworpen door de System Enhancement Associates (SEA).
.zip Extensie van de compressiemethode Zip, ontworpen door PkWare.
Algoritme Een eindige reeks stappen waarin een bepaald (wiskundig) probleem kan worden opgelost. Goede algoritmes vormen vaak de basis van een efficiënt computerprogramma.
ASCII De afkorting ASCII staat voor American Standard Code for Information Interchange. Met behulp van deze standaardcode worden letters, cijfers en leestekens gecodeerd. Zo heeft de letter ‘A’ het ASCII-getal 65 en de letter ‘a’ 97.
Bestandscompressor Een programma dat bestanden softwarematig comprimeert.
Bit In de digitale- of informatie techniek de kleinste hoeveelheid informatie. Aan of Uit, Ja of Nee, Hoog of Laag, True of False. Eén enkel cijfer van een binair getal.
Boomdiagram Een boomdiagram is een diagram met vertakkingen; Dat zijn (meestal) uitgebreide diagrammen met lijntjes naar het volgende iets. Je ziet dit soort diagrammen bijv. bij stambomen. Er is iets aan de top (man-vrouw), daaronder de kinderen. Daaronder de kinderen van de kinderen et cetera.
Comprimeren Het kleiner maken van een bestand, al dan niet met gegevensverlies.
End-of-file markering De end-of-file is bij besturingssystemen een voorwaarde wat aangeeft dar er geen gegevens meer uit de gegevensbron gelezen kan worden.
Extensie Achtervoegsel van een bestand (bijvoorbeeld .ZIP), waaruit af te leiden valt welk type van informatie het bevat (ZIP = gecomprimeerd archief) en met welke programma’s je het lezen of bewerken (PKZIP, PKUNZIP of WinZip).
Frames Eén enkel beeld waaruit een animatie, een videofilmpje of bijvoorbeeld een Tv-uitzending is opgebouwd.
Frequentie Geeft aan hoe vaak een bepaalde uitkomst waargenomen is.
Macroblokken Blokken van 8 bij 8 pixels in een afbeelding.
Maskeringen Eigenschap van het menselijk gehoor.
Als er een zacht geluid aanwezig is tegelijk met een hard geluid zullen we onder bepaalde omstandigheden het zachte geluid in het geheel niet meer kunnen waarnemen.
Metadata Metadata geeft informatie over het bestand zoals bronnen voor titels en auteur. Ook geeft het de lay-out en technische informatie van het bestand weer.
nul-bytebestand Een nul-bytebestand is een bestand zonder gegevens. Wat betekent dat het bestand een grootte van nul bytes heeft.
Pixel Beeldpunt op een computerscherm. Dit is dus als het ware het atoom van een (raster)afbeelding. Binnen een kleursysteem wordt de kleur van een pixel uitgedrukt in een numerieke waarde voor de rode, groene en blauwe component (RGB-waarde) en kan daarbij elk van de beschikbare 16.7 miljoen kleuren aannemen.
Redundantie Overtolligheid.
Significant Een term uit de statistiek (wiskunde); de uitkomst (bijv. een verschil tussen twee gemiddelden) berust met 95% zekerheid niet op toeval.
Transformatie Omzetting (van iets) in een andere vorm.
Bijlage 2: Gekozen algoritmes
Tabel 6: Keuze compressie extensies.
Extensie: Beschrijving: Mening / Opmerkingen:
.zip Het meest gebruikte compressieformaat op Microsoft Windows. Het wordt ook veel gebruikt op Macintosh- en Unix-systemen. • Chester: Is denk ik wel de beste compressor om te gebruiken en waarschijnlijk ook de makkelijkste, dus het is misschien beter als we deze gebruiken als beginpunt.
• Maarten: De meest bekende, kunnen we gebruiken als een soort ijklijn/vergelijk.
.alz Een overwegend Koreaans formaat ontworpen voor zeer grote archieven.
Een methode die vooral in Korea gebruikt wordt. Vooral gebruikt voor zeer grote archieven • Chester: het lijkt me minder fijn om een Koreaanse format te gebruiken omdat er waarschijnlijk weinig over te vinden is op internet over deze compressor.
• Maarten: Het lijkt me leuk om ook een format te gebruiken die in Nederland eigenlijk niet eens gebruikt wordt.
.yz1 Yamazaki zipper archive. Compressie-indeling wat gebruikt wordt in ‘DeepFreezer archiver’, het is een hulpprogramma gemaakt door Yamazaki Satoshi. Het ‘helpt’ de programma’s TUGZip, IZArc en ZipZag met lezen en schrijven van data. • Chester: Het is wel fijn dat er veel over te lezen is voor de achtergrondinformatie.
• Maarten: Het lijkt me leuk om ook een format te gebruiken die in Nederland eigenlijk niet eens gebruikt wordt.
.qda Wordt gebruikt voor gegevens in games die zijn geschreven met behulp van de Quadruple D-bibliotheek voor Delphi. Gebruikt bytepaarcompressie.
• Chester: Sinds ik heel erg geïnteresseerd ben in games lijkt deze me wel leuk.
• Maarten: We hebben geen game samples, dus deze valt voor mij af.
.car Gemaakt door Yaakov Gringeler; de laatste versie is uitgebracht in 2003, maar is failliet gegaan. Toch kan je een gratis proefversie van 30 dagen gebruiken, waarmee de gebruiker archieven kan maken en uitpakken; daarnaast is het mogelijk om uit te pakken, maar je kan niet inpakken • Chester: Ik denk dat we wel veel minder mogelijkheden hebben met een gratis versie, dus deze lijkt mij minder.
• Maarten: dit is een betaalde versie waar we een free trail voor kunnen krijgen. Dit belooft in mijn ogen een hoge kwaliteit (Compressie is vrijwel niet te vinden op internet).
.arc Een van de eersten die compressie en archivering in één enkel programma aanbood. Later vervangen door PKZIP. • Chester: Deze lijkt me wel leuk om te gebruiken omdat het zo oud is.
• Maarten: De voorloper van .zip. Het lijkt me leuk om hierover meer te weten te komen.