Spend pr indbygger figuren er en simplificering af en række datasæt
De stiplede linier: indikerer hhv. maksimum- og minimumsgrænsen for potentielle outliers i datamaterialet.
Den blå linie: dette er din kommunes spend pr indbygger og samtidigt din kommunes rank blandt de 97 andre kommuner i datasættet.
Den røde linie er 90% kvartilen: Ligger din kommune over denne linie, så er din kommune blandt de 10% af kommunerne med højest spend pr indbygger.
Den grønne linie er 10% kvartilen: Ligger din kommune under denne linie, så er din kommune blandt de 10% af kommunerne med lavest spend pr indbygger.
Ovenstående figur er blevet til ved en simplificering af nedenstående boxplots.
Box- og Whiskerplot, nogle gange blot kaldet boxplot, er en type graf, der hjælper med at visualisere 5-numre-resuméet. Det viser ikke fordelingen så detaljeret som histogrammet, men det er især nyttigt til at angive, om en fordeling er skæv, og om der er potentielle usædvanlige observationer (outliers) i datasættet. Et boxplot er ideelt til at sammenligne distributioner, fordi centrum, spredning og overordnet rækkevidde er umiddelbart synlige.
- Hvert boxplot har en farve – hver farve er et datasæt (år) – i dette tilfælde spend pr indbygger i danske kommuner.
- Den vandrette linje, der deler de enkelte bokse i to, er medianen.
- Gennemsnittet er angivet med et kryds.
- Boksene dækker det interkvartile interval, hvor 50 % af dataene for det pågældende år findes. Hhv. 25% over og under medianen.
- Halerne er de to linjer uden for boksen, der afsluttes med en lille vandret streg,
- Vi har begrænset længden af halerne til maksimalt 1,5 gange interkvartilafstanden. Det vil sige, at halen når den værdi, der er længst fra midten, mens den stadig er inden for en afstand på 1,5 gange interkvartilafstanden fra den nedre eller øvre kvartil.
- Datapunkter, der er uden for dette interval, er repræsenteret som punkter på grafen og betragtes som potentielle outliers.
Kommentarer
0 kommentarer
Log ind for at kommentere.