Numeriska mått
Kort version
Medelvärdet - summan av observationerna delat på antalet observationer. (Kap 4.2.) Download (Kap 4.2.)
Medianen - det mellersta värdet i storleksordning (eller medelvärdet av de två mellersta värdena om antalet observationer är jämnt). (Kap 4.3.) Download (Kap 4.3.)
Standardavvikelsen - ett spridningsmått där enheten är densamma som den ursprungliga variabeln. (Kap 4.4.) Download (Kap 4.4.)
Medelfelet - (SE för standard error) mäter spridningen i det beräknade medelvärdet. (Kap 4.5.) Download (Kap 4.5.)
Variansen - standardavvikelsen upphöjt till två. (Kap 4.6.) Download (Kap 4.6.)
Längre version
Medelvärde
Observationer kan sammanfattas med en rad olika mått, där lägesmått beskriver var på tallinjen observationerna är centrerade. Det absolut vanligaste lägesmåttet är det aritmetiska medelvärdet (eng. arithmetic mean eller average), som ofta kallas enbart medelvärdet. Medelvärdet ges av summan av observationerna delat på antalet observationer. För ett stickprov betecknas medelvärdet med x̄ och beräknas enligt ˉx=x1+x2+...+xnn där n anger antalet mätvärden och xi anger stickprovets värden (x1 är t.ex den första observationen, x10 den tionde o.s.v). x̄, (x-streck) är den vanliga beteckningen för medelvärdet.
Median
Ett annat lägesmått är medianen (eng. median), som är det storleksmässigt mellersta talet i mätserien. Det betyder att hälften av observationerna är mindre än medianen och hälften är större än medianen. För att fastställa medianen behöver talen först ordnas i storleksordning. Medianen utgörs sedan av det mellersta värdet för en talserie med udda antal värden, eller medelvärdet av de två mellersta värdena för en talserie med jämnt antal värden. Medianen påverkas mindre av extremvärden än medelvärdet och är anses därför vara ett mer robust lägesmått.
Standardavvikelsen
Spridningsmått beskriver hur utspridda observationerna är. Standardavvikelsen s är ett mått på spridning i ett datamaterial. Det ges av
s=√(x1−ˉx)2+(x2−ˉx)2+...+(xn−ˉx)2n−1,
vilket beräknas genom att ta skillnaden mellan observationerna och medelvärdet, kvadrera skillnaderna, summera kvadraterna, dela summan med n − 1, och ta roten ur kvoten (*pust*).
En enklare beskrivning, men inte teoretiskt helt korrekt, skulle vara säga att standardavvikelsen uttryckte medelavvikelsen från medelvärdet.
Medelfelet
Förkortas SE även på svenska där SE står för standard error och mäter spridningen i det beräknade medelvärdet. Medelfelet ges av standardavvikelsen delat på roten ur antalet observationer.
SE=s√n.
Variansen
Det vanligaste spridningsmåttet är definitivt standardavvikelsen, men variansen förekommer i några utskrifter i Excel. Nackdelen med variansen är att den inte är i samma enhet som de ursprungliga observationerna eftersom det är ett kvadratiskt mått. Variansen är helt enkelt standardavvikelsen i kvadrat och betecknas s2.
Exempel
Ett försök på virusgulsot i betor i fem försöksfält ger följande värden på andel plantor med virusangrepp: 3,2, 5,0, 1,4, 9,2, 6,4.
- Summerar man alla värdena får man x1 + x2 + x3 + x4 + x5 = 3,2 + 5,0 + 1,4 + 9,2 + 6,4 = 25,2 och medelvärdet blir därmed 25,2/5,0 = 5,04. I Excel använder man funktionen MEDEL för att beräkna medelvärdet.
- För att beräkna medianen ordnar man materialet i storleksordning: 1,4, 3,2, 5,0, 6,4, 9,2. Medianen ges då av det mellersta värdet, 5,0. Om man har ett jämnt antal observationer ges medianen av medelvärdet av de två mittersta observationerna. I Excel heter funktionen MEDIAN.
- Med siffrorna på virusangrepp blir standardavvikelsen s = 2,9913. Det kan beräknas med STDAV.S i Excel.
- Variansen ges därmed av s2 = 8,95. Det kan beräknas med VARIANS.S i Excel.
- Medelfelet ges av 2,9913/2,2361 = 1,3378, där 2,2361 är roten ur 5. Medelfelet saknar en direkt formel i Excel, men kan tas fram genom att skriva in beräkningen. Kvadratroten ges av funktionen ROT.
Länkar
Khan academy, Measuring center in quantitative data Links to an external site.
Khan academy, Variance and standard deviation of a sample