varians och standardavvikelse Definition och beräkning
varians och standardavvikelse används allmänt mått på spridning av data eller, i finans och investering, mått på volatilitet i tillgångspriserna.
variansen definieras och beräknas som den genomsnittliga kvadrerade avvikelsen från medelvärdet. Standardavvikelse beräknas som kvadratroten av varians eller i full definition, standardavvikelse är kvadratroten av den genomsnittliga kvadrerade avvikelsen från medelvärdet.,
dessa definitioner kan låta förvirrande när de påträffas för första gången. För detaljerad förklaring hur man beräknar båda åtgärderna, se beräkna varians och standardavvikelse i 4 enkla steg.
beskriva vs. prognoser i statistik
i allmän statistik utför två huvuduppgifter. Dess mål är antingen att beskriva något som redan har hänt eller redan existerar (beskrivande statistik), eller att uppskatta något som inte har hänt än eller inte är helt känt (inferentiell statistik).,
beskrivande statistik behandlar problemet hur man effektivt tittar på data som vi redan har. Inferentiell statistik (uppskattningen och prognosdelen av statistiken) behandlar problemet med att inte ha alla data.
av dessa två breda områden av statistik är inferentiell statistik Den som är mycket mer intressant och mycket oftare används i finans och investeringar. När allt kommer omkring, som investerare eller spekulanter, måste vi ofta möta problemet att vi vill veta vad vi inte vet (till exempel om stock XYZ kommer att gå upp eller ner i morgon och hur mycket).,
Population vs Sample
den primära uppgiften för inferentiell statistik (eller uppskattning eller prognos) gör en åsikt om något genom att bara använda ett ofullständigt urval av data.
i statistiken är det mycket viktigt att skilja mellan befolkning och prov. En population definieras som alla medlemmar (t.ex. förekomster, priser, årlig avkastning) i en viss grupp. Befolkningen är hela gruppen.
ett prov är en del av en population som används för att beskriva egenskaperna (t.ex. medelvärde eller standardavvikelse) för hela populationen., Storleken på ett prov kan vara mindre än 1%, eller 10%, eller 60% av befolkningen, men det är aldrig hela befolkningen.
Population vs Provvarians och standardavvikelse
Vid beräkning av varians och standardavvikelse är det viktigt att veta om vi beräknar dem för hela befolkningen med alla data, eller vi beräknar dem med endast ett urval av data. I det första fallet kallar vi dem befolkningsvarians och befolkningsstandardavvikelse. I det andra fallet kallar vi dem provvarians och prov standardavvikelse.,
exempel 1: Befolkningsvarians och standardavvikelse
fråga: Vad är standardavvikelsen för förra årets avkastning på de 12 fonder jag har investerat i?
det finns ingen uppskattning eller prognos i denna uppgift. Jag är bara intresserad av de 12 fonder jag har investerat I och jag bryr mig inte om de tusentals andra fonder som finns i världen. Min befolkning är bara dessa 12 medel. Jag har alla data tillgängliga, eftersom det är mycket lätt att hitta dessa 12 fonders resultatuppgifter.,
jag tar resultatet av var och en av de 12 fonderna under det senaste året, beräkna medelvärdet, då avvikelserna från medelvärdet, kvadrera avvikelserna, summera de kvadrerade avvikelserna, dividera med 12 (antalet medel) och få variansen. Då är kvadratroten av varians standardavvikelsen. I det här fallet, eftersom jag har data för hela befolkningen tillgänglig, kallar jag dem befolkningsvarians och befolkningsstandardavvikelse.
exempel 2: Provvarians och standardavvikelse
fråga: Vad är standardavvikelsen för förra årets avkastning på aktiefonder i världen?,
jämfört med att beräkna standardavvikelse för konkret specificerade 12-fonder vill jag nu veta standardavvikelsen för avkastning på alla aktiefonder i världen. Min befolkning är nu mycket större än i föregående exempel. Det finns tusentals aktiefonder i världen. Några av dem är förmodligen inte på Bloomberg, har ingen webbplats och publicerar inte deras prestanda. Kort sagt, Jag har ingen chans att jag kunde få data för alla medel. Och även om jag kunde, skulle det ta lång tid och kosta mycket pengar för att få all data.,
i motsats till det tidigare exemplet har jag nu inte alla data tillgängliga och jag måste uppskatta befolkningens standardavvikelse från ett prov.
uppskatta populationens standardavvikelse från ett prov
Så hur ska jag göra det? Jag kommer att försöka samla in data för några av aktiefonderna – dessa medel kommer att vara mitt urval. Det är inte nödvändigt (och förmodligen inte möjligt) att samla in data för alla medel i världen (befolkningen). Jag måste bara se till att mitt prov är tillräckligt stort., Samtidigt som uppgifterna för fem fonder förmodligen skulle vara otillräckliga för att uppskatta standardavvikelsen för hela befolkningen, kan 100 fonders uppgifter vara tillräckligt och fortfarande mycket realistiska för att få.
med data för dessa 100-medel beräknar jag variansen och standardavvikelsen på samma sätt som i Exempel 1 med mina 12-medel.
skillnaden i beräkning: Population vs Provvarians
det finns bara en liten skillnad i beräkningen av varians och det är i slutet av det., För både population och provvarians beräknar jag medelvärdet, sedan avvikelserna från medelvärdet, och sedan kvadrerar jag alla avvikelser. Jag sammanfattar alla kvadrerade avvikelser upp. Hittills var det detsamma för både population och provvarians.
När jag beräknar befolkningsvarians delar jag sedan summan av kvadrerade avvikelser från medelvärdet med antalet objekt i befolkningen (i Exempel 1 dividerade jag med 12).
När jag beräknar provvarians delar jag den med antalet objekt i provet mindre. I vårt exempel 2 delar jag med 99 (100 minus 1).,
som ett resultat kommer den beräknade provvariansen (och därför också standardavvikelsen) att vara något högre än om vi skulle ha använt populationsvariansformeln. Syftet med denna lilla skillnad det för att få en bättre och opartisk uppskattning av befolkningens varians (genom att dividera med provstorleken sänkt med en, kompenserar vi för det faktum att vi bara arbetar med ett prov snarare än med hela befolkningen).
i guiden för att beräkna varians och standardavvikelse beräknade vi befolkningsvarians och standardavvikelse., För provvarians och standardavvikelse är den enda skillnaden i steg 4, där vi nu delar med antalet objekt mindre en.,
Population and Sample Variance and Standard Deviation Formulas
For those who like formulas, here they are:
Population Variance
Population Standard Deviation
Sample Variance
Sample Standard Deviation
Calculating Variance and Standard Deviation in Excel
In Excel, variance and standard deviation can be easily calculated using the built-in functions: VAR.P, VAR.S, STDEV.,P, och STDAV.S (Naturligtvis kan du också beräkna dem direkt med hjälp av formlerna ovan om du vill). Du kan se hur beräkningen fungerar i praktiken (liksom beräkningen av skewness, kurtosis och andra åtgärder) i den beskrivande statistik Excel-kalkylatorn.