metanohi/site/thesis/index.md

128 lines
4.6 KiB
Markdown

---
abstract: My master's thesis, including an overview of it in Danish.
lastupdated: 2017
---
# My Master's Thesis
I submitted my MSc thesis in computer science in October 2017.
It is titled "Memory Block Merging in Futhark".
[Download the thesis.](niels-thesis.pdf)
![Hedgehogs: Faster than you might think.](hedgehogs.jpg){width=820}
## Resumé
(This section is in Danish.)
Velkommen til det danske resumé af mit speciale. På dansk hedder mit
speciale "Hukommelsesblokfletning i Futhark". Undskyld hvis resuméet er
forvirrende og uklart. Det er svært at beskrive på kort plads, og en
del af det kræver nok en vis computerviden.
## Strukturbaggrund
I 2011 begyndte jeg på datalogistudiet på Københavns Universitet. I
starten af 2015 fik jeg en *bachelorgrad* derfra, og senere på året
begyndte jeg så på *kandidaten*, som er den anden del af uddannelsen.
Nu har jeg her i 2017 så brugt et halvt år på at skrive mit *speciale*,
som er den endelige opgave på kandidaten. Når jeg har forsvaret
(præsenteret) specialet, får jeg en *kandidatgrad*.
## Indholdsbaggrund
Der er to hoveddele i titlen:
+ Hukommelsesblokfletning
+ Futhark
*Hukommelsesblokfletning* er et delvist opfundet ord som jeg groft sagt
siger betyder "at tage flere områder hukommelse (fra RAM) i en computer
og ændre dem så de bruger det samme område, så vi sparer hukommelse".
Dette er den teoretiske del af mit speciale.
*Futhark* er et programmeringssprog rettet mod at køre programmer på
grafikkort -- ikke for at lave 3D, men for at lave generelle tunge
udregninger på smarte måder der passer til hardwarens fordele og
begrænsninger. Futhark er et eksisterende sprog og har en hjemmeside på
[futhark-lang.org](http://futhark-lang.org/) hvor man kan læse mere om
det.
Futhark-sproget har en tilhørende *oversætter* som tager
Futhark-programmer og oversætter dem til at kunne køre på grafikkort.
Jeg har i mit speciale udvidet denne oversætter til at lave
hukommelsesblokfletning, hvilket vi kalder en *optimering*. Dette er
den praktiske del af mit speciale.
## Eksempel
Her et et computerprogram på et meget abstrakt niveau:
1. Gør plads til et stort billede. Kald pladsen $M$.
2. Indlæs et stort billede. Kald det $I$ og læg det i pladsen $M$.
3. Udskriv det store billede $I$.
4. Gør plads til endnu et stort billede. Kald pladsen $M2$.
5. Indlæs et nyt stort billede. Kald det $I2$ og læg det i pladsen $M2$.
6. Udskriv det store billede $I2$.
Vi har to store billeder som skal udskrives på en printer. I trin 1
fortæller vi computeren at vi skal have plads til et stort billede. I
trin 2 indlæser vi et stort billede (fx fra en fil) og fortæller
computeren at det skal ligge der hvor vi har gjort plads til det. I
trin 3 fortæller vi så computeren at den skal udskrive billedet. I trin
4-6 gentages dette, bare med et nyt stort billede.
Det er fjollet både at gøre trin 1 og trin 4. Det første billede bliver
aldrig brugt mere efter det er udskrevet i trin 3, så dets plads $M$ kan
egentlig godt genbruges. Vi ændrer derfor programmet til at have 5
trin:
1. Gør plads til et stort billede. Kald pladsen $M$.
2. Indlæs et stort billede. Kald det $I$ og læg det i pladsen $M$.
3. Udskriv det store billede $I$.
4. Indlæs et nyt stort billede. Kald det $I2$ og læg det i pladsen $M$.
5. Udskriv det store billede $I2$.
Trin 4 genbruger nu den allerede brugte plads $M$ i stedet for at bruge
en ny plads. Vi har flettet hukommelsesblokkene $M$ og $M2$ og sparet
plads.
Det her er et meget simplificeret eksempel, men idéen er nogenlunde
derhenaf.
## Resultater
Målet med min optimering er at
+ få programmer i Futhark til at bruge mindre hukommelse, samt at
+ få programmer i Futhark til at køre lidt hurtigere.
Futhark har en masse eksisterende større programmer som jeg har oversat
og kørt både *uden* mine optimeringer og *med* mine optimeringer. Deres
resultater har jeg så sammenlignet.
Med mine optimeringer bruger programmerne mellem 0% (ingen ændring) og
70% mindre *hukommelse*, hvilket er godt. De bliver mellem -28%
(dvs. langsommere) og 16% *hurtigere*, hvilket er et lidt mere blandet
resultat. Dog har jeg en okay idé om hvorfor nogle af dem bliver
langsommere (læs mere om det i selve specialet).
## Resten
Der er mange flere eksempler i rapporten, og der er de beskrevet bedre
end her. Jeg har også forsøgt at *formalisere* mine optimeringer, men
det gik knapt så godt.
Koden ligger på
[github.com/diku-dk/futhark/](https://github.com/diku-dk/futhark/). Kig
i mappen `src/Futhark/Optimise/MemoryBlockMerging/`. Det er okay, men
ikke helt poleret.