3 sätt att beräkna summan av kvadrater för fel (SSE)

Summan av kvadrerade fel, eller SSE, är en preliminär statistisk beräkning som leder till andra datavärden. När du har en uppsättning datavärden är det användbart att kunna hitta hur nära relaterade dessa värden är. Du måste få dina data organiserade i ett bord och sedan utföra några ganska enkla beräkningar. När du hittat SSE för en dataset kan du sedan fortsätta att hitta variansen och standardavvikelsen.

Steg

Metod 1 av 3:

Beräkna SSE för hand

1. Skapa ett tre kolumnbord. Det tydligaste sättet att beräkna summan av kvadrerade fel börjar med ett tre kolumnbord. Märk de tre kolumnerna som

Värde

${ text {värde}}$ ,

Avvikelse

${ text {avvikelse}}$ , och

Avvikelse 2

${ text {avvikelse}} ^ {2}$ .

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 2

2. Fyll i data. Den första kolumnen håller värdena för dina mätningar. Fyll i

Värde

${ text {värde}}$ kolumn med värdena för dina mätningar. Dessa kan vara resultatet av något experiment, en statistisk studie eller bara data som tillhandahålls för ett matteproblem.

Anta i det här fallet att du arbetar med vissa medicinska data och du har en lista över kroppstemperaturerna på tio patienter. Den normala kroppstemperaturen förväntas är 98.6 grader. Temperaturerna på tio patienter mäts och ger värdena 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2, och 99.1. Skriv dessa värden i den första kolumnen.

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 3

3. Beräkna medelvärdet. Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet av den fullständiga dataset.

Minns att medelvärdet av någon dataset är summan av värdena, dividerat med antalet värden i uppsättningen. Detta kan representeras symboliskt, med variabeln

μ

$mu$ representerar medelvärdet, som:

μ = Σ x n

$mu = { frac { sigma x} {n}}$

För denna data beräknas medelvärdet som:

μ = 99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1 10

$mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}$

μ = \frac{988.7}{10}

$mu = { frac {988.7} {10}}$

μ = 98.87

$mu = 98,87$

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 4

4. Beräkna de enskilda felmätningarna. I den andra kolumnen i ditt bord måste du fylla i felmätningarna för varje datavärde. Felet är skillnaden mellan mätningen och medelvärdet.

För den angivna dataseten, subtrahera medelvärdet, 98.87, från varje uppmätt värde och fyll i den andra kolumnen med resultaten. Dessa tio beräkningar är följande:

99.0 - 98.87 = 0.13

$99,0-98.87 = 0,13$

98.6 - 98.87 = - 0.27

$98,6-98.87 = -0,27$

98.5 - 98.87 = - 0.37

$98,5-98.87 = -0,37$

101.1 - 98.87 = 2.23

$101,1-98.87 = 2,23$

98.3 - 98.87 = - 0.57

$98,3-98.87 = -0.57$

98.6 - 98.87 = - 0.27

$98,6-98.87 = -0,27$

97.9 - 98.87 = - 0.97

$97,9-98.87 = -0,97$

98.4 - 98.87 = - 0.47

$98,4-98.87 = -0,47$

99.2 - 98.87 = 0.33

$99,2-98.87 = 0,33$

99.1 - 98.87 = 0.23

$99,1-98.87 = 0,23$

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 5

5. Beräkna kvadraterna på felen. I den tredje kolumnen i tabellen, hitta torget av var och en av de resulterande värdena i mitten kolumnen. Dessa representerar kvadraterna av avvikelsen från medelvärdet för varje uppmätt värde av data.

För varje värde i mitten kolumnen, använd din räknare och hitta torget. Spela in resultaten i den tredje kolumnen, enligt följande:

0.13 2 = 0.0169

$0,13 ^ {2} = 0,0169$

(- 0.27) 2 = 0.0729

$(-0,27) ^ {2} = 0,0729$

(- 0.37) 2 = 0.1369

$(-0,37) ^ {2} = 0,1369$

2.23 2 = 4.9729

$2,23 ^ {2} = 4,9729$

(- 0.57) 2 = 0.3249

$(-0,57) ^ {2} = 0,3249$

(- 0.27) 2 = 0.0729

$(-0,27) ^ {2} = 0,0729$

(- 0.97) 2 = 0.9409

$(-0,97) ^ {2} = 0,9409$

(- 0.47) 2 = 0.2209

$(-0,47) ^ {2} = 0,2209$

0.33 2 = 0.1089

$0,33 ^ {2} = 0,1089$

0.23 2 = 0.0529

$0,23 ^ {2} = 0,0529$

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 6

6. Lägg till kvadraterna av fel tillsammans. Det sista steget är att hitta summan av värdena i den tredje kolumnen. Det önskade resultatet är SSE, eller summan av kvadrerade fel.

För denna dataset beräknas SSE genom att lägga ihop de tio värdena i den tredje kolumnen:

S S E = 6.921

$SSE = 6,921$

Metod 2 av 3:

Skapa ett Excel-kalkylblad för att beräkna SSE

1. Märk kolumnerna i kalkylbladet. Du kommer att skapa ett tre kolumnbord i Excel, med samma tre rubriker som ovan.

I Cell A1 skriver du in rubriken "Värde."
I cell B1 anger du rubriken "Avvikelse."
I Cell C1, ange rubriken "Deviation Squared."

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 8

2. Skriv in din data. I den första kolumnen måste du skriva in värdena för dina mätningar. Om uppsättningen är liten kan du helt enkelt skriva in dem för hand. Om du har en stor datasats kan du behöva kopiera och klistra in data i kolumnen.

Bild med titeln Beräkna summan av kvadrater för fel (SSE) Steg 9

3. Hitta medelvärdet av datapunkterna. Excel har en funktion som beräknar medelvärdet för dig. I en ledig cell under din datatabell (det spelar ingen roll vilken cell du väljer), ange följande:

= Medelvärde (A2: ___)

Skriv egentligen inte ett tomt utrymme. Fyll i det tomma med cellnamnet för din senaste datapunkt. Till exempel, om du har 100 poäng data, kommer du att använda funktionen:

= Medelvärde (A2: A101)

Denna funktion innehåller data från A2 till A101 eftersom den övre raden innehåller rubrikerna i kolumnerna.

När du trycker på Enter eller när du klickar bort till någon annan cell på bordet, kommer medelvärdet av dina datavärden automatiskt att fylla den cell som du just programmerade.

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 10

4. Ange funktionen för felmätningarna. I den första tomma cellen i kolumnen "Avvikelse" måste du ange en funktion för att beräkna skillnaden mellan varje datapunkt och medelvärdet. För att göra detta måste du använda cellnamnet där medelvärdet är bosatt. Låt oss anta nu när du använde Cell A104.

Funktionen för felberäkningen, som du går in i cell B2, kommer att vara:

= A2- $ A $ 104.Dollarns tecken är nödvändiga för att se till att du låser i cell A104 för varje beräkning.

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 11

5. Ange funktionen för felkvadraterna. I den tredje kolumnen kan du rikta Excel för att beräkna torget som du behöver.

I Cell C2, ange funktionen

= B2 ^ 2

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 12

6. Kopiera funktionerna för att fylla hela bordet. När du har angett funktionerna i den övre cellen i varje kolumn, respektive B2 och C2 måste du fylla i hela bordet. Du kan skriva in funktionen i varje rad i bordet, men det skulle ta alltför länge. Använd musen, markera cellerna B2 och C2 tillsammans, och utan att släppa musknappen, dra ner till den nedre cellen i varje kolumn.

Om vi antar att du har 100 datapunkter i ditt bord, drar du musen ner till cellerna B101 och C101.

När du släpper musknappen, kopieras formlerna till alla celler i tabellen. Bordet ska fyllas automatiskt med de beräknade värdena.

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 13

7. Hitta SSE. Kolumn C i ditt bord innehåller alla kvadratfelvärden. Det sista steget är att ha Excel beräkna summan av dessa värden.

I en cell under bordet, förmodligen C102 i det här exemplet, ange funktionen:

= Summa (c2: c101)

När du klickar på Enter eller klickar bort i någon annan cell i bordet, bör du ha SSE-värdet för dina data.

Metod 3 av 3:

Relaterar till SSE till andra statistiska data

1. Beräkna varians från SSE. Att hitta SSE för en dataset är i allmänhet ett byggstenar för att hitta andra, mer användbara värden. Den första av dessa är varians. Variansen är en mätning som indikerar hur mycket de uppmätta data varierar från medelvärdet. Det är faktiskt det genomsnittliga av de kvadrerade skillnaderna från medelvärdet.

Eftersom SSE är summan av de kvadrerade felen, kan du hitta det genomsnittliga (vilket är variansen), bara genom att dividera med antalet värden. Men om du beräknar variansen av ett provuppsättning, snarare än en fullständig befolkning, kommer du att dela med (n-1) istället för n. Således:

Varians = SSE / N, om du beräknar variansen av en full befolkning.
Varians = SSE / (n-1), om du beräknar variansen av en provuppsättning av data.

För provproblemet med patientens temperaturer kan vi anta att 10 patienter representerar endast en provuppsättning. Därför skulle variansen beräknas som:

Variation = Sse (n - 1)

${ text {varians}} = { frac {{ text {sse}}} {(n-1)}}}}}$

Variation = \frac{6.921}{9}

${ text {varians}} = { frac {6.921} {9}}$

Variation = 0.769

${ text {varians}} = 0,769$

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 15

2. Beräkna standardavvikelse från SSE. Standardavvikelsen är ett vanligt nytt värde som indikerar hur mycket värdena för vilken datasats som avviker från medelvärdet. Standardavvikelsen är kvadratroten av variansen. Minns att variansen är medelvärdet av kvadratfelmätningarna.

Därför, efter att du beräknat SSE, kan du hitta standardavvikelsen enligt följande:

Standardavvikelse = \sqrt{Sse} n - 1

${ Text {Standard Deviation}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}$

För dataprovet av temperaturmätningarna kan du hitta standardavvikelsen enligt följande:

Standardavvikelse = \sqrt{Sse} n - 1

${ Text {Standard Deviation}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}$

Standardavvikelse = \sqrt{\frac{6.921}{9}}

${ Text {Standard Deviation}} = { sqrt {{ frac {{ text {6.921}}} {9}}}}$

Standardavvikelse = \sqrt{.769}

${ text {standardavvikelse}} = { sqrt {.769}}$

Standardavvikelse = 0.877

${ text {standardavvikelse}} = 0,877$

Bild med titeln Beräkna summan av kvadrater för fel (SSE) steg 16

3. Använd SSE för att mäta kovarians. Denna artikel har fokuserat på dataset som endast mäter ett enda värde i taget. Men i många studier kan du jämföra två separata värden. Du skulle vilja veta hur de två värdena relaterar till varandra, inte bara till medelvärdet av dataset. Detta värde är kovariansen.

Beräkningarna för kovarians är för inblandade i detalj här, förutom att notera att du kommer att använda SSE för varje datatyp och sedan jämföra dem. För en mer detaljerad beskrivning av kovarians och de berörda beräkningarna, se Beräkna kovarians.

Som ett exempel på användningen av kovarians kanske du vill jämföra patienternas åldrar i en medicinsk studie till effektiviteten av ett läkemedel vid sänkning av febertemperaturer. Då skulle du ha en datasats av åldrar och en andra datatemperatur. Du skulle hitta SSE för varje dataset, och därefter hittar du variansen, standardavvikelser och kovarians.

Tips

Dela på det sociala nätverket:

Hur man beräknar summan av kvadrater för fel (sse)

Steg

Tips