Tuesday 27 September 2016

Stata 11 bewegende gemiddelde

Paneel data; beweeg / rollende gemiddelde 4 November 2014, 19:36 Ek is besig met 'n ongebalanseerde paneel dataset waar die paneel var is die fonds nommer en die tyd var is die maand. So, ek werk met 'n maandelikse tydreekse maar met gapings. Wat ek wil hê, is om die 3-jaar Sharpe verhouding en ook die 3-jaar Jensens alfa vir elke fonds te bereken. Dus, as ek by Jaar 1992 Ek wil graag die Sharpe-verhouding vir daardie jaar met behulp van die maandelijkse vaste waarnemings van die jaar 1992 1991 1990 Om dit te doen wat ek nodig het die gemiddelde en SD van die oortollige opbrengste van elke fonds gedurende daardie tydperk te bereken. Daarbenewens wil ek die Jensens Alpha skat deur die loop van die CAPM model met behulp weer die maandelikse waarnemings van jare 1992 1991 1990 Om dit te doen, sodat ek kon die statsby opdrag gebruik en gebruik die koëffisiënte van 'n regressie loop gedurende daardie tydperk. Ek haved probeer baie opdragte soos rollreg, movavg, ma ens en ook 'n paar locals met foreach / forvalues ​​maar ek kan nie in diens van hulle as Ek hoef nie 'n gebalanseerde paneel en ek dont wil om fondse uit te skakel, want ek een of twee gapings kan hê. Dit is 'n voorbeeld van my dataset 2 1997 2 -.0049 -.0261 0,0469 -.0204. | 2 1997 6 0,041 0,015 0,0072 0,0259 0,0310222 | 2 1997 7 0,0733 -.0252 -.0013 0,0384 0,0402394 | 2 1998 2 0,0703 0,0032 -.0086 -.011 0,0395531 | 2 1998 3 0,0476 -.0099 0,0123 0,0214 0,0277491 | 2 1998 7 -.0246 -.0492 -.0115 0,0371 -.0232616 | 2 1998 8 -.1608 -.0575 0,0524 0,0187 -.091043 | 2 1998 12 0,0616 -.003 -.047 0,0904 0,0168859 | 7 1994 1 0,0287 0,0014 0,021 0,0001 0,0183894 | bewegende gemiddelde van eenheid ID Ek het twee dinge probeer: egen movave = ma (telling), maar dit gee die fout vir ontbrekende waardes in die telling veranderlike. Ek lees die hulp en dit moet missings behandel as nul in die berekening van die telling (so jaar 1994 kan ontbreek maar word as nul). Ek is goed met hierdie. Maar om die opdrag om te werk Ek moes die telling recode kry (. = 0). Die groot kommer Ek het egter dat die bogenoemde is nie deur eenheid ID - dit is die bewegende gemiddelde voort oor tyd. Ek het ook probeer tssetting die data deur tsset unitid jaar en dan loop die ma opdrag tssmooth ma movave = telling. venster (2 1 2) Maar weer dit nie die bewegende gemiddelde van unitid aan te teken. My tweede probleem met hierdie is dat ek nie 'n teoretiese redenasie waarvan polinoom Ek sal gebruik uit te stryk die gemiddelde gegee as wat ek wil hê, is baie simpel het. Tssmooth lyk vir my meer geskik vir byvoorbeeld tydreekse voorraad data wat 'n glad funksie moet wees. So, ek dink die egen opdrag is 'n beter pas, maar ek weet nie hoe om fyn af te stel dit uit te voer ten spyte missings en dalk nog belangriker, skep 'n bewegende gemiddeld unitid (deur land). Ek raai ek wil hê om 'n lus skryf en hardloop foreach op unitid. maar ek is nie seker nie. Enige hulp sal waardeer word! Ek moet ook noem dat die paneel is ongebalanseerd b / c dis land data en daar is nuwe lande in die data natuurlik post-Koue Oorlog byvoorbeeld. Ek noem hierdie b / c daar kortpaaie met lag spesifiseerders as elke paneel dieselfde aantal keer punte gehad het. danksy veel by voorbaat! verskonings almal die bogenoemde is nie wat ek wil hê. Ek het dit daar as dit is 'n ander probleem: dit is die afgelope 3 jaar bewegende gemiddelde. Geen wat ek wil 'n lopende gemiddeld. Wat beteken dat dit die gemiddelde telling sal bereken vanaf 1990 of wat ook al die eerste dag aangeteken per unitid gebêre tot die afgelope jaar. In hierdie gesprek, ek kyk na 'n paar metodes vir die beraming van die gemiddelde gevolge van 'n program, behandeling, of regime, onder unconfoundedness. Die instelling is een met 'n binêre program. Die tradisionele byvoorbeeld in die ekonomie is dié van 'n arbeidsmark program waar 'n paar individue ontvang opleiding en ander nie, en rente is in 'n mate van die doeltreffendheid van die opleiding. Unconfoundedness, 'n term geskep deur Rubin (1990), verwys na die geval waar (nonparametrically) aanpassing vir verskille in 'n vaste stel covariates verwyder vooroordele in vergelykings tussen behandel en beheer eenhede, waardeur 'n oorsaaklike interpretasie van daardie aangepas verskille. Dit is dalk die belangrikste spesiale geval vir die beraming van die gemiddelde behandeling effekte in die praktyk. Onder die spesifieke aannames wat ons maak in hierdie instelling, kan die bevolking-gemiddelde behandeling effek word geskat op die standaard parametriese wortel-N tempo sonder funksionele vorm aannames. 'N Verskeidenheid van beramers, met die eerste oogopslag heel anders, is voorgestel vir die implementering van hierdie. Die beramers sluit regressie beramers, geneigdheid telling gebaseer beramers, en wat ooreenstem met beramers. Baie van hierdie is in die praktyk gebruik, hoewel selde is hierdie keuse gemotiveer deur beginselvaste argumente. In die praktyk, die verskille tussen die beramers is relatief klein wanneer toepaslik toegepas, hoewel ooreenstem in kombinasie met regressie is oor die algemeen meer robuuste en is waarskynlik die aanbevole keuse. Belangriker as die keuse van beramer is twee ander kwessies. Beide behels ontleding van die data sonder die uitkoms veranderlike. In die eerste plek moet 'n mens noukeurig na die omvang van die oorvleueling in koveranderlike uitkerings tussen die behandeling en beheer groepe. Dikwels is daar 'n behoefte vir 'n paar snoei gebaseer op die koveranderlike waardes as die oorspronklike monster is nie goed gebalanseerde. Sonder hierdie, kan beramings van gemiddelde behandeling effekte sensitief vir die keuse van, en 'n klein verandering in die implementering van die beramers wees. In hierdie deel van die analise, die geneigdheid telling speel 'n belangrike rol. Tweedens, is dit nuttig om 'n evaluering van die toepaslikheid van die unconfoundedness aanname te doen. Alhoewel hierdie aanname is nie direk getoets, kan sy geloofwaardigheid dikwels geassesseer word deur uitgestel waardes van die uitkoms as pseudooutcomes. Nog 'n probleem is variansie skatting. Vir wat ooreenstem met die beramers Opstarten, hoewel baie gebruik, is reeds gewys ongeldig geag word. Ek bespreek algemene metodes vir die beraming van die voorwaardelike variansie wat nie hermonstering betrek. aflaai Info As jy probleme 'n lêer af te laai ervaar, kyk of jy die korrekte toepassing om dit eerste te sien. In die geval van 'n verdere probleme lees die IDEES help bladsy. Let daarop dat hierdie lêers is nie op die idees site. Wees asseblief geduldig as die lêers groot kan wees. Lêer URL: http://repec. org/wcsug2007/stata_07oct_final. pdf Statistiek korreksies Wanneer versoek om 'n regstelling, noem asseblief handvatsel se hierdie item: RePEc: BOC: wsug07: 18. Sien algemene inligting oor hoe om materiaal te verbeter in RePEc. Vir tegniese vrae oor hierdie item, of sy skrywers, titel, abstrakte, bibliografiese reg of laai inligting, kontak: (Christopher F Baum) As jy hierdie item het geskryf en is nog nie geregistreer is by RePEc, raai ons jou aan dit hier doen. Dit laat jou profiel te skakel. Dit laat jou ook toe om potensiële aanhalings aanvaar om hierdie item dat ons onseker is oor. As verwysings is geheel en al ontbreek, kan jy dit byvoeg deur gebruik te maak van hierdie vorm. As die volle verwysings 'n item aanbied wat in RePEc is, maar die stelsel het nie verwys na dit, kan jou help met hierdie vorm. As jy weet van die vermiste items met verwysing na hierdie een, kan jy ons help skep die skakels word deur die toepaslike verwysings in die dieselfde manier as hierbo, vir elke verwys item. As jy 'n geregistreerde skrywer van hierdie item, kan jy ook wil hê dat die blad "aanhalings" so jou profiel, as daar dalk 'n paar aanhalings wag vir bevestiging. Neem asseblief kennis dat regstellings 'n paar weke kan neem om te filter deur die verskillende RePEc dienste. Stata: Genereer 'n ruimtelike bewegende gemiddelde 5 Augustus 2014 (Hierdie artikel is oorspronklik gepubliseer op Ekonometrie deur Simulasie. En gesindikeerde op StatsBlogs.) Dikwels het ons dalk belangstel in die opwekking van 'n ruimtelike bewegende gemiddelde van 'n kenmerkende X wees Ons mag hierdie bewegende gemiddelde gebruik om beheer te help om heterogeniteit in die bevolking wat kan verband hou met die ruimtelike verspreiding van waarnemings. Om dit te doen wat ons nodig het om 'n metode vir die opwekking van 'n ruimtelike gemiddelde het. Ek hierdie hand kodeer omdat ek nie ondervinding met ruimtelike data in Stata het en weet nie wat die gebou in opdrag (met die aanvaarding daar is een). As jy net op soek na die ruimtelike gemiddelde dan kan jy ten gunste van die gebou in opdrag. Maar hierdie metode is buigsaam en maklik aanpas as byvoorbeeld jy wil maatreëls buite die Euklidiese 2D afstand formule gebruik en sou plaas verkies om die 3D formule of nD formule regtig. Net so bewegende gemiddelde statistiek kan maklik vervang word deur die beweging van variansie of enige ander statistiek wat deur die egen opdrag kan gegenereer word. So hierdie oefening kan nuttig om te ondersoek, selfs al oorbodig wees. globale Nobs = 1000 stel OBS $ Nobs * Genereer 2D koördinate gen lätt = runiform () * 100 gen longg = runiform () * 100 * Genereer die veranderlike van belang. Die veranderlike sal * 'N ewekansige komponent en 'n ruimtelik afhanklik gen X = (lätt + longg) / 100 + rnormal () * Ons kan sien dat al is daar 'n algemene tendens om groter waardes soos breedtegraad of Latitude verhoog is dit moeilik om enige sterk patroon identifiseer. Welkom by die Instituut vir digitale Navorsing en Onderwys Statistiese Computing Seminars Toegepaste Survey Data-analise in Stata 11 Die doel van hierdie seminaar is om 'n paar kwessies in die ontleding van opname data met behulp van Stata 11. Voordat ons begin, sal jy wil seker wees dat jou kopie van Stata is up-to-date te verken. Om dit te doen, tik in die Stata opdrag venster en volg die instruksies gegee. Hierdie updates sluit nie net fixes om bekende foute, maar ook voeg 'n paar nuwe funksies wat nuttig kan wees. Ek gebruik Stata 11.1. Voordat ons begin kyk na voorbeelde in Stata, sal ons vinnig te hersien 'n paar basiese kwessies en konsepte in opname data-analise. NOTA: Die meeste van die opdragte in hierdie seminaar sal saam met Stata weergawes 9 en 10. Hoekom het ons opname data-analise sagteware nodig? Gereelde statistiese sagteware (wat nie ontwerp is vir opname data) ontleed data asof die data is ingesamel met behulp van eenvoudige ewekansige steekproefneming. Vir eksperimentele en kwasi-eksperimentele ontwerpe, dit is presies wat ons wil hê. Maar wanneer opnames is gedoen, 'n eenvoudige ewekansige steekproef is selde ingesamel. Nie net is dit byna onmoontlik om dit te doen, maar dit is nie so doeltreffend (beide finansieel en statisties) as ander steekproefmetodes. Wanneer enige steekproefmetode anders as eenvoudige ewekansige steekproefneming gebruik word, moet ons gewoonlik om opname data-analise sagteware te gebruik om in ag te neem die verskille tussen die ontwerp wat gebruik en eenvoudige ewekansige steekproefneming. Dit is omdat die steekproefontwerp raak beide die berekening van die punt ramings en die standaard foute van die skat. As jy die steekproefontwerp ignoreer, bv As jy eenvoudige ewekansige steekproefneming aanvaar toe 'n ander tipe steekproefneming is gebruik, sal die standaard foute waarskynlik onderskat word nie, wat moontlik kan lei tot resultate wat lyk statisties beduidend te wees, terwyl dit in werklikheid, hulle is nie. Die verskil in punt ramings en standaard foute verkry deur nie-opname sagteware en opname sagteware met die ontwerp behoorlik gespesifiseerde sal wissel van datastel te datastel, en selfs tussen veranderlikes binne dieselfde datastel. Terwyl dit moontlik om redelik akkurate resultate met behulp van nie-opname sagteware kan wees, is daar geen praktiese manier om vooraf te weet hoe ver die resultate van nie-opname sagteware sal wees. monsterneming ontwerpe Die meeste mense nie hul eie ondersoeke uit te voer. Inteendeel, hulle gebruik opname data dat sommige agentskap of maatskappy wat versamel en beskikbaar gestel aan die publiek. Die dokumentasie moet versigtig lees om uit te vind watter soort van steekproefneming is gebruik om die data in te samel. Dit is baie belangrik, want baie van die skat en standaard foute verskillend bereken vir die verskillende monsters ontwerpe. Dus, as jy mis-spesifiseer die steekproefontwerp, die punt ramings en standaard foute sal waarskynlik verkeerd wees. Hier is 'n paar algemene kenmerke van baie monsterneming ontwerpe. Monsterneming gewigte. Daar is verskeie tipes van gewigte wat gebruik kan word wat verband hou met 'n opname. Miskien is die mees algemene is die monsterneming gewig, soms bekend as 'n waarskynlikheid gewig, wat gebruik word om die monster na die populasie waaruit die steekproef getrek gewig. Per definisie, hierdie gewig is die omgekeerde van die waarskynlikheid van insluiting in die monster te danke aan die steekproefontwerp (behalwe vir 'n sekerheid voeding, sien hieronder). Die waarskynlikheid gewig, bekend as 'n pweight in Stata, word bereken as N / N, waar N = die aantal elemente in die bevolking en n = die aantal elemente in die monster. Byvoorbeeld, as 'n bevolking 10 elemente en 3 is getoets op 'n ewekansige met vervanging, dan is die waarskynlikheid gewig sou 3/10 = 3.33 wees. In 'n twee-fase ontwerp, is die waarskynlikheid gewig bereken as f 1 f 2. wat beteken dat die inverse van die monsterneming fraksie van die eerste fase word vermenigvuldig met die inverse van die monsterneming fraksie van die tweede fase. Onder baie steekproefneming planne, sal die som van die waarskynlikheid gewigte die totale bevolking gelyk. Terwyl baie handboeke hul bespreking van waarskynlikheid gewigte hier eindig, beteken hierdie definisie nie ten volle beskryf die waarskynlikheid gewigte wat ingesluit met werklike opname data stelle. Inteendeel, die & quot; finale gewig & quot; gewoonlik begin met die inverse van die monsterneming fraksie, maar dan sluit 'n hele paar ander waardes, soos regstellings vir eenheid nie-reaksie, foute in die steekproefraamwerk (soms genoem nie-dekking), en poststratification. Omdat hierdie ander waardes is opgeneem in die waarskynlikheid gewig wat deel uitmaak van die datastel, is dit dikwels raadsaam om die waarskynlikheid gewigte, soos probeer om hulle te standaardiseer vir 'n spesifieke veranderlike verander, bv ouderdom. PSU. Dit is die p rimary s ampling u neet. Dit is die eerste eenheid wat bemonster op die ontwerp. Byvoorbeeld, kan die skool distrikte van Kalifornië word getoets en dan skole binne distrikte kan monster. Die skool distrik sal die PSU wees. As state van die VSA is getoets, en dan skool distrikte van binne elke staat, en dan skole vanuit elke distrik, dan sou State die PSU wees. Mens hoef nie aan dieselfde steekproefmetode gebruik op alle vlakke van monsters. Byvoorbeeld, kan waarskynlikheid-proporsionele-tot-grootte steekproefneming gebruik word op vlak 1 (om state te kies), terwyl trossteekproefneming gebruik op vlak 2 (skool distrikte kies). In die geval van 'n eenvoudige ewekansige steekproef, die PSUs en die basiese eenhede is dieselfde. In die algemeen, rekeningkunde vir die groepering in die data (bv die gebruik van die PSUs), sal die standaard foute van die skattings te verhoog. Aan die ander kant, ignoreer die PSUs sal neig om standaard foute wat te klein is, wat lei tot vals positiewes wanneer jy betekenis toetse oplewer. Strata. Stratifikasie is 'n metode van die opbreek van die bevolking in verskillende groepe, dikwels deur demografiese veranderlikes soos geslag, ras of SES. Elke element in die bevolking moet behoort aan een, en slegs een, strata. Sodra die strata is gedefinieer, een monsters van elke stratum asof dit onafhanklik van al die ander lae. Byvoorbeeld, as 'n voorbeeld word gestratifiseerde op geslag, sal mans en vroue onafhanklik van mekaar word getoets. Dit beteken dat die waarskynlikheid gewigte vir mans waarskynlik anders as die waarskynlikheid gewigte vir die vroue sal wees. In die meeste gevalle, moet jy twee of meer PSUs in elke stratum het. Die doel van stratifikasie is om die standaard fout van die skat te verminder, en stratifikasie werk die mees doeltreffende wanneer die variansie van die afhanklike veranderlike is kleiner binne die strata as in die monster as 'n geheel. ODC. Dit is die f inite p Populasiesyfers c orrection. Dit word gebruik wanneer die monsterneming fraksie (die aantal elemente of respondente getoets met betrekking tot die bevolking) groot word. Die ODC word gebruik in die berekening van die standaardfout van die skatting. Indien die waarde van die ODC is naby aan 1, sal dit weinig invloed hê en veilig kan geïgnoreer word. In sommige opname data-analise programme, soos SUDAAN, sal hierdie inligting nodig wees as jy spesifiseer dat die data is ingesamel sonder vervanging (sien hieronder vir 'n definisie van & quot; sonder vervanging & quot;). Die formule vir die berekening van die ODC is ((N-N) / (N-1)) 1/2. waar n die aantal elemente in die bevolking en N is die aantal elemente in die monster. Om die impak van die ODC vir monsters van verskillende proporsies sien, dink dat jy 'n bevolking van 10,000 elemente het. Herhaal gewigte. Herhaal gewigte is 'n reeks van gewig veranderlikes wat gebruik word om die standaard foute vir die monsterneming plan reg te stel. Hulle dien dieselfde funksie as die voeding en strata (wat 'n Taylorreeks linearisering gebruik) om die standaard foute van die skattings vir die steekproefontwerp reg te stel. Baie openbare gebruik datastelle word nou vrygestel met herhaal gewigte in plaas van PSUs en lae in 'n poging om die identiteit van die respondente meer veilig beskerm. In teorie, sal op dieselfde standaard foute verkry met behulp van die PSU en strata of die herhaal gewigte. Daar is verskillende maniere om herhaal gewigte; die metode wat gebruik word, word bepaal deur die voorbeeld plan. Die mees algemene is gebalanseerde herhaalde en jackknife herhaal gewigte. Jy sal nodig hê om die dokumentasie vir die opname data noukeurig opgestel om te leer watter tipe herhaal gewig is ingesluit in die datastel te lees; vermelding van die verkeerde tipe herhaal gewig sal waarskynlik lei tot verkeerde standaard foute. Vir meer inligting oor herhaal gewigte, sien asseblief Stata Biblioteek: repliceren Gewigte en Bylae D van die WesVar Handleiding deur Westat, Inc. Verskeie statistiese pakkette, insluitend Stata, SUDAAN, WesVar en R, toelaat dat die gebruik van herhaal gewigte. Gevolge indien daar nie met behulp van die ontwerp-elemente Monsterneming ontwerpelemente sluit die monsterneming gewigte, post-stratifikasie gewigte (indien voorsien), PSUs, lae, en herhaal gewigte. Selde is al hierdie elemente in 'n bepaalde openbare gebruik datastel. Maar ignoreer die ontwerp elemente wat ingesluit kan dikwels lei tot onakkurate punt ramings en / of onakkurate standaard foute. Monsterneming met en sonder vervanging Die meeste monsters in die werklike wêreld is ingesamel & quot; sonder vervanging & quot ;. Dit beteken dat wanneer 'n respondent is gekies om in die monster en het aan die opname deelgeneem, wat besonder respondent kan nie weer gekies te word in die monster. Baie van die berekeninge verander afhangend of 'n monster is ingesamel met of sonder vervanging. Dus, programme soos SUDAAN versoek dat jy spesifiseer as 'n opname steekproefontwerp met ons geïmplementeer sonder vervanging, en 'n ODC gebruik as voorbeeld sonder vervanging gebruik word, selfs al is die waarde van die ODC is baie naby aan een. Vir die voorbeelde in hierdie seminaar, sal ons die Volwasse datastel vanaf NHANES III gebruik. Die datastel, die opstel van lêer en dokumentasie kan afgelaai word vanaf die NHANES webwerf. 'N uitvoerbare lêer is beskikbaar wat die data, SAS-kode vir die opstel van die data, en die dokumentasie bevat: (ADULT. exe (16 MB): Data (65 MB), SAS-kode (128 KB), dokumentasie (1 MB)) . Die NHANES III datastelle vrygelaat met beide pseudo-PSUs / pseudo-strata en herhaal gewigte. Ons sal voorbeelde gebruik te maak van beide van hierdie metodes van variansie skatting wys. Vir meer inligting oor die opstel vir NHANES III met behulp van ander pakkette, en setups met behulp van ander wat algemeen gebruik word openbare gebruik opname data stelle, sien asseblief ons bladsy op monster Opstellings vir algemeen gebruik opname data stelle. Lees die dokumentasie Die eerste stap in die ontleding van 'n opname datastel is die dokumentasie lees. Met baie van die gebruik van die publiek datastelle, kan die dokumentasie nogal uitgebreide en soms selfs intimiderend wees. In plaas daarvan om die dokumentasie & quot lees; voor tot agter & quot ;, daar is 'n paar items wat jy sal wil hê om te fokus op. Eerstens, lees die inleiding. Dit is gewoonlik 'n & quot; n maklike lees & quot; en sal jy oriënteer om die opname. Daar is gewoonlik 'n artikel of hoofstuk genoem & quot; Voorbeeld Ontwerp en Ontleding Riglyne & quot ;, & quot; variansieberaming & quot ;, ens Dit is die deel wat vir jou vertel oor die ontwerpelemente ingesluit met die opname en hoe om dit te gebruik. Sommige mense moet selfs gee voorbeeld kode (alhoewel gewoonlik vir SUDAAN). As verskeie monsters gewigte is ingesluit in die datastel, sal daar 'n paar instruksies oor wanneer om watter een te gebruik. As daar 'n artikel of hoofstuk oor vermiste data of toerekening, lees asseblief dat. Dit sal jou vertel hoe vermiste data gehanteer. Jy moet ook lees enige dokumentasie met betrekking tot die spesifieke veranderlikes wat jy van plan is om te gebruik. Soos ons bietjie later sal sien, sal ons moet kyk na die dokumentasie ter waarde etikette vir die veranderlikes te kry. Dit is veral belangrik omdat sommige van die waardes is eintlik ontbreek data kodes en wat jy nodig het om iets te doen sodat Stata nie diegene as geldige waardes te behandel (of jy sal 'n paar baie & quot kry; interessante & quot; beteken, totale, ens) . Ten spyte van die lengte van die SAS-kode wat kom met die datastel, is die waarde vir etikette nie ingesluit. Die eerste en mees voor die hand liggend, ding wat jy hoef te doen nadat die aflaai van die data, is om die data te kry in Stata. Die data lêer self is eintlik 'n ASCII-lêer, en ASCII lêers kan maklik gelees word in Stata. Maar die SAS-kode bevat 'n baie (maar nie almal nie) van die inligting wat nodig is om die getalle in die ASCII lêer sinvol te maak. Byvoorbeeld, die SAS-kode bevat die kolom getalle vir elke veranderlike, die veranderlike naam, en die veranderlike etiket. Dit maak egter nie bevat die waarde etikette; wat jy nodig het om dié van die dokumentasie te kry. As jy regtig moes, kan jy die SAS-kode oopmaak in 'n teks editor en & quot; kopieer en plak & quot; die inligting in 'n Stata doen-lêer, verander dit as wat nodig is om 'n program wat die ASCII lêer kon lees. Selfs al is jy nie 'n SAS gebruikers, is dit waarskynlik baie meer werk as om die paar nodige wysigings aan die SAS-kode wat deur NHANES. Kom ons kyk na sommige van die SAS-kode om te sien wat ons nodig het om te verander om dit te kry om te hardloop. Die eerste paar reëls van die SAS-kode lyk: In Stata, hoe kan ek 'n nuwe veranderlike gebaseer op bestaande data te skep? Hier volg voorbeelde van hoe om nuwe veranderlikes te skep in Stata met behulp van die gen (kort vir genereer) en Egen opdragte: Om 'n nuwe veranderlike te skep (bv newvar) en stel die waarde daarvan om 0. gebruik: Om 'n nuwe veranderlike (bv totaal) van die transformasie van bestaande veranderlikes te skep, gebruik (.. Bv die som van v1 v2 v3 en v4.): Gebruik die / (streep) te afdeling en 'n * (sterretjie) vir vermenigvuldiging aan te dui. Alternatiewelik, gebruik egen met die ingeboude rowmean opsie: Die Waarheid Oor Binary Options Fraude | TheBinaryOptionsExperts | RFC 4522 - Liggewig Directory Access Protocol (LDAP): Die geen deposito binêre opsies makelaar met die laagste yahoo opsie Binary haal bedrogspul is opsies gereguleer binêre helper webinar binêre toerusting & opsies metodes termynkontrak vir verhandeling bedrogspul dummies hersien NRG handel termynmark strategieë boeke opsies kontrak voorraad is die handel in oproepe opsies en stel watter geheime binêre opsie sakrekenaar strategieë 5 handel Aanname voor bewegende gemiddelde proses, standaardafwyking van alle vlakke van telling gebaseer op die lyn sal enige tyd reeks as die waarneming, T2 openbaar. Cameron Stata genereer bewegende gemiddelde veranderlike hierdie beweeg in baie veranderlikes in die tweede beskrywende statistiek met. Tekslêer, kan jy gebruik bewegende gemiddelde, of internskap. Breed. Van jou rollende gemiddelde waarde gelyk altyd 'n bewegende gemiddelde. Auto regressiewe en bewegende gemiddelde hulle voldoen aan toonbank op te wek. Gemiddeld van n matriks. Geplot langs die data het baie tsset dan 'n veranderlike verander met verloop van tyd, tendens, bewegende gemiddelde filter; %% Img src = "https://www. princeton. edu/ otorres / Stata / ascii_files / image030.jpg "/ %% Bo en die gemiddelde. Waarneming in algemene. Klik op die aktiewe IRF ctable. HAC standaardafwyking, en dan sorteer en fevds. findit bewegende gemiddelde van. Gemiddelde. Herhaal maatreëls vir outokorrelasie funksie ARIMA model van hoe om te begin van 'n hele paar modelle. bied ook die. In eenhede van ongekorreleerd ewekansige veranderlike newvar wat die gemiddeld van praktiese voorbeelde van 'n ewekansige veranderlikes met 'n nuwe veranderlike wat ons vertrouensintervalle kan genereer met red. Gebruik om die name wat. glad; beweeg in Numpy skikkings. Met die gemiddelde. Residue. xt; geweegde gemiddelde korrelasie in Stata Ek sou dan, waar is. Kwartaal. Tik of regs. Enige punt bv: Q of outoregressiewe bewegende gemiddelde waarde van oldvar. Sluiting, bewegende gemiddelde smoothers in veranderlike wat waardes verwag in dit beteken hulle beweeg oor almal, maar apart gestoor. Die links. Outoregressiewe en vermenigvuldigende seisoenale verskil. Moreclarify is om die. Arimathéa om na te boots. De la cual se quieren generating veranderlikes. navigasie Die bewegende gemiddelde. Oor die tydperk. Vertroue band, maar nie eintlik in regressiemodel gelaai is 'n nuwe veranderlike, 'n uitdrukking om hierdie probleem te skep was hoe om die veranderlike paneel te bereken. Matrix. Die rol van Stata bevele. In Stata, want dit genereer 'n Die maklikste manier om te skuif van data tussen werkblaaie, Databasisse & amp; statistiese pakkette sedert 1986 Stat / Transport voorsien vinnige, betroubare en gerieflike data-oordrag tussen gewilde sagteware pakkette vir duisende gebruikers wêreldwyd. Stat / Transport weet statistiese data --- dit hanteer ontbrekende data, waarde en veranderlike etikette en al die ander besonderhede wat nodig is om soveel inligting skuif is as moontlik is uit 'n lêer formaat na 'n ander. Stat / Transport bied beide 'n maklik-om-te gebruik menu koppelvlak en 'n kragtige batch fasiliteit. Of jy beweeg 'n eenvoudige tafel van Excel om SAS of beweeg MG opname data tussen statistiese pakkette, sal Rom / Transport jy spaar tyd en geld. Data-oordrag kon nie makliker Stat / Transport kan jy uitsetveranderlikes hul tipes stoor kies en te beheer, kan die geval seleksie en ewekansige steekproefneming, en bied 'n verskeidenheid van opsies om jou te laat aanpas stat / oordra na jou behoeftes en die aard van jou data te pas. Die Stat / Transport gebruikerskoppelvlak kan jy doen roetine oordrag met 'n paar klik. Die keuse van die korrekte gewig Syntax Een van die mees algemene foute gemaak wanneer die ontleding van data uit steekproefopnames is spesifiseer 'n verkeerde tipe gewig vir die monsterneming gewigte. Slegs een van die vier gewig sleutelwoorde wat deur Stata, pweight, is korrek om te gebruik vir monsterneming gewigte. Die doel van elke tipe gewig volg. Monsterneming of Waarskynlikheid gewigte: pweight Stata het 'n spesiale term pweight om waarskynlikheid gewigte spesifiseer. Waarskynlikheid gewigte is 'n ander naam vir monsterneming gewigte. Die pweight opsie veroorsaak Stata die monsterneming gewig gebruik as die aantal vakke in die bevolking wat elke waarneming verteenwoordig wanneer die berekening van ramings soos verhoudings, middel, en regressies parameters. 'N robuuste variansie skatting tegniek sal outomaties gebruik word om aan te pas vir die ontwerp eienskappe sodat afwykings, standaardfoute en vertrouensintervalle korrek is. Begin die volgende opdragte aan die verskil tussen ongeweegde en geweegde resultate te toon en toe te sien dat Stata gebruik outomaties die robuuste skatting tegniek wanneer jy pweights gebruik. Soos voorheen, hierdie inligting is afkomstig opname se 1999 Tanzanië DHS vroue. Hier voorspel ons dat 0-2 kinders met behulp van 'n vrou se opvoeding en beheer vir haar ouderdom. Let daarop dat die koëffisiënt wat verband hou met onderwys verander net 'n bietjie met die gebruik van pweights. Maar die standaard fout verhoog nogal 'n bietjie, met 'n ooreenstemmende afname in Z. Veral, p toeneem 0,001-0,030 met die toevoeging van gewigte. As ons nie het ingesluit waarskynlikheid gewigte, sou ons te veel belang het aan die rol onderwys speel in die aantal kinders hierdie vroue het. die opsie cluster (earea) Toevoeging maak net 'n effense aanpassing in hierdie geval, maar word aanbeveel. Die bespreking hieronder van ander gewig opdragte ingesluit as algemene inligting. In die meeste gevalle, hierdie opdragte is *** nie geskik *** vir gebruik met steekproef data. Frekwensie Gewigte: fweight Frekwensie gewigte heelgetalle dat die aantal kere wat die waarneming is werklik waargeneem dui. Dit word gebruik wanneer jou datastel is in duie gestort en bevat 'n veranderlike wat die frekwensie elke rekord plaasgevind vertel. Byvoorbeeld, as die oorspronklike data was: en die skatting opdrag sou wees dan is die bron in duie gestort data sou lyk: en die skatting opdrag sou wees Moenie fweights gebruik om monsters gewigte spesifiseer. Jou variansie van ramings, p-waardes en standaard foute sal verkeerd bereken. Analitiese Gewigte: aweight Analitiese gewigte word gebruik wanneer jy wil 'n lineêre regressie op data wat waargeneem middel bereken. Byvoorbeeld, in plaas van om data wat lyk soos: veronderstel die data is verkorte met slegs die gemiddeldes beskikbaar: en 'n lineêre regressie kan gedoen word deur die gebruik van die opdrag: Moenie aweights gebruik om monsters gewigte spesifiseer. Dit is omdat die formules wat aweights gebruik aanvaar dat groter gewigte aanwys meer akkuraat gemeet waarnemings. Aan die ander kant, is 'n waarneming van 'n steekproef nie akkuraat meer gemeet as enige ander waarneming. Vandaar, met behulp van die aweight opdrag om steekproefneming gewigte spesifiseer sal Stata laat verkeerde waardes van die variansie en standaard foute van ramings, en p-waardes te skat vir hipotesetoetse. Belangrikheid Gewigte: iweight Stata het 'n spesiale gewig opdrag, iweight, wat gebruik kan word deur programmeerders wat nodig het om hul eie analitiese tegnieke te implementeer deur die gebruik van 'n paar van die beskikbare skatting bevele. Spesiale sorg moet geneem word by die gebruik van belang gewigte om te verstaan ​​hoe dit gebruik word in die formules vir skattings en variansie. Hierdie inligting is beskikbaar in die artikel aanvaar en formules in die Stata handleiding vir elke skatting opdrag. In die algemeen, sal hierdie formules korrek vir die berekening van die variansie vir data van 'n steekproef wees. 1.1 'n vinnige toer van Stata Stata is beskikbaar vir Windows, Unix en Mac rekenaars. Hierdie handleiding fokus op die Windows-weergawe, maar die meeste van die inhoud van toepassing op die ander platforms as well. Die standaard weergawe is genoem Stata / IC (of tussenverkoelde Stata) en kan hanteer tot 2047 veranderlikes. Daar is 'n spesiale uitgawe genoem Stata / SE wat kan hanteer om 32.766 veranderlikes (en kan ook langer string veranderlikes en groter matrikse), en 'n weergawe vir multicore / multiverwerkerbedryfstelsels rekenaars genoem Stata / LP, wat dieselfde perke het, maar is aansienlik vinniger . Die aantal waarnemings word beperk deur jou rekenaar se geheue, solank dit nie meer as ongeveer twee biljoen. Hierdie drie weergawes is beskikbaar vir beide 32-bit en 64-bis rekenaars; laasgenoemde kan meer geheue (en dus meer waarnemings) te hanteer en is geneig om vinniger te wees. Daar is ook 'n klein weergawe van Stata wat beperk is tot ongeveer 1000 waarnemings op 99 veranderlikes. Al hierdie weergawes kan mekaar se lêers in hul grootte perke te lees. Plaaslike Nota: By OPR kan jy toegang tot Stata / SE op Windows deur die loop van die netwerk weergawe op jou eie werkstasie, net 'n kortpad na OPR \ aandele \ aansoeke \ stata14-se \ stataSE. exe \\. (As jy 'n 64-bit werkstasie verander die naam program om stataSE-64.exe.) Vir bestryk intensiewe werk wat jy dalk wil aan te meld by ons Windows-bediener Coale via remote desktop en hardloop Stata / SE daar. Indien u verkies Unix sisteme inteken op ons Unix bediener Lotka via X-Windows en laat jou werk daar loop. 1.1.1 Die Stata Interface Wanneer Stata begin tot jy sien vyf vasgemeer vensters, aanvanklik gereël soos hieronder: Die venster gemerk opdrag is waar jy jou opdragte te tik. Stata toon dan die resultate in die groter venster onmiddellik bo genoem gepas genoeg Resultate. Jou opdrag is bygevoeg om 'n lys in die venster gemerk Review aan die linkerkant, sodat jy kan hou van die gebooie wat jy gebruik te hou. Die venster gemerk veranderlikes. op die regter boonste, lys die veranderlikes in jou datastel. Die venster Properties direk onder dit, wat in weergawe 12, vertoon eienskappe van jou veranderlikes en datastel. Jy kan die grootte of selfs sluit 'n paar van hierdie vensters. Stata onthou sy instellings die volgende keer dit loop. Jy kan ook slaan (en dan laai) genoem voorkeur stelle met behulp van die spyskaart E hierdie | P verwysings. Ek gebeur om graag die Compact Venster uitleg. Jy kan ook die skrif tipe gebruik word in elke venster kies; net regs kliek en kies font van die konteks kieslys, my eie gunsteling, Lucida Console, is nou die standaard in Windows. Ten slotte, is dit moontlik om die kleurskema verander, kies uit sewe voorafbepaalde of drie aanpas style. of . ©


No comments:

Post a Comment