Hur man beräknar summan av kvadrater för fel (sse)
Summan av kvadrerade fel, eller SSE, är en preliminär statistisk beräkning som leder till andra datavärden. När du har en uppsättning datavärden är det användbart att kunna hitta hur nära relaterade dessa värden är. Du måste få dina data organiserade i ett bord och sedan utföra några ganska enkla beräkningar. När du hittat SSE för en dataset kan du sedan fortsätta att hitta variansen och standardavvikelsen.
Steg
Metod 1 av 3:
Beräkna SSE för hand1. Skapa ett tre kolumnbord. Det tydligaste sättet att beräkna summan av kvadrerade fel börjar med ett tre kolumnbord. Märk de tre kolumnerna som , , och .
2. Fyll i data. Den första kolumnen håller värdena för dina mätningar. Fyll i kolumn med värdena för dina mätningar. Dessa kan vara resultatet av något experiment, en statistisk studie eller bara data som tillhandahålls för ett matteproblem.
3. Beräkna medelvärdet. Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet av den fullständiga dataset.
4. Beräkna de enskilda felmätningarna. I den andra kolumnen i ditt bord måste du fylla i felmätningarna för varje datavärde. Felet är skillnaden mellan mätningen och medelvärdet.
5. Beräkna kvadraterna på felen. I den tredje kolumnen i tabellen, hitta torget av var och en av de resulterande värdena i mitten kolumnen. Dessa representerar kvadraterna av avvikelsen från medelvärdet för varje uppmätt värde av data.
6. Lägg till kvadraterna av fel tillsammans. Det sista steget är att hitta summan av värdena i den tredje kolumnen. Det önskade resultatet är SSE, eller summan av kvadrerade fel.
Metod 2 av 3:
Skapa ett Excel-kalkylblad för att beräkna SSE1. Märk kolumnerna i kalkylbladet. Du kommer att skapa ett tre kolumnbord i Excel, med samma tre rubriker som ovan.
- I Cell A1 skriver du in rubriken "Värde."
- I cell B1 anger du rubriken "Avvikelse."
- I Cell C1, ange rubriken "Deviation Squared."
2. Skriv in din data. I den första kolumnen måste du skriva in värdena för dina mätningar. Om uppsättningen är liten kan du helt enkelt skriva in dem för hand. Om du har en stor datasats kan du behöva kopiera och klistra in data i kolumnen.
3. Hitta medelvärdet av datapunkterna. Excel har en funktion som beräknar medelvärdet för dig. I en ledig cell under din datatabell (det spelar ingen roll vilken cell du väljer), ange följande:
4. Ange funktionen för felmätningarna. I den första tomma cellen i kolumnen "Avvikelse" måste du ange en funktion för att beräkna skillnaden mellan varje datapunkt och medelvärdet. För att göra detta måste du använda cellnamnet där medelvärdet är bosatt. Låt oss anta nu när du använde Cell A104.
5. Ange funktionen för felkvadraterna. I den tredje kolumnen kan du rikta Excel för att beräkna torget som du behöver.
6. Kopiera funktionerna för att fylla hela bordet. När du har angett funktionerna i den övre cellen i varje kolumn, respektive B2 och C2 måste du fylla i hela bordet. Du kan skriva in funktionen i varje rad i bordet, men det skulle ta alltför länge. Använd musen, markera cellerna B2 och C2 tillsammans, och utan att släppa musknappen, dra ner till den nedre cellen i varje kolumn.
7. Hitta SSE. Kolumn C i ditt bord innehåller alla kvadratfelvärden. Det sista steget är att ha Excel beräkna summan av dessa värden.
Metod 3 av 3:
Relaterar till SSE till andra statistiska data1. Beräkna varians från SSE. Att hitta SSE för en dataset är i allmänhet ett byggstenar för att hitta andra, mer användbara värden. Den första av dessa är varians. Variansen är en mätning som indikerar hur mycket de uppmätta data varierar från medelvärdet. Det är faktiskt det genomsnittliga av de kvadrerade skillnaderna från medelvärdet.För provproblemet med patientens temperaturer kan vi anta att 10 patienter representerar endast en provuppsättning. Därför skulle variansen beräknas som:
- Eftersom SSE är summan av de kvadrerade felen, kan du hitta det genomsnittliga (vilket är variansen), bara genom att dividera med antalet värden. Men om du beräknar variansen av ett provuppsättning, snarare än en fullständig befolkning, kommer du att dela med (n-1) istället för n. Således:
- Varians = SSE / N, om du beräknar variansen av en full befolkning.
- Varians = SSE / (n-1), om du beräknar variansen av en provuppsättning av data.
2. Beräkna standardavvikelse från SSE. Standardavvikelsen är ett vanligt nytt värde som indikerar hur mycket värdena för vilken datasats som avviker från medelvärdet. Standardavvikelsen är kvadratroten av variansen. Minns att variansen är medelvärdet av kvadratfelmätningarna.
3. Använd SSE för att mäta kovarians. Denna artikel har fokuserat på dataset som endast mäter ett enda värde i taget. Men i många studier kan du jämföra två separata värden. Du skulle vilja veta hur de två värdena relaterar till varandra, inte bara till medelvärdet av dataset. Detta värde är kovariansen.
Tips
Dela på det sociala nätverket: