Thursday 5 October 2017

Moving Gjennomsnittet Økonometri


Flytte gjennomsnittlig - MA. BREAKING DOWN Flytte gjennomsnittlig - MA. As et SMA eksempel, betrakt en sikkerhet med følgende lukkepriser over 15 dager. Veil 1 5 dager 20, 22, 24, 25, 23.Week 2 5 dager 26, 28 , 26, 29, 27.Week 3 5 dager 28, 30, 27, 29, 28.A 10-dagers MA ville gjennomsnittlig sluttprisene de første 10 dagene som det første datapunktet. Det neste datapunktet ville slippe den tidligste pris, legg til prisen på dag 11 og ta gjennomsnittet, og så videre som vist nedenfor. Som tidligere notert, lagrer MAs nåværende prishandling fordi de er basert på tidligere priser, jo lengre tidsperioden for MA, desto større er lagret slik en 200-dagers MA vil ha en mye større grad av forsinkelse enn en 20-dagers MA fordi den inneholder priser for de siste 200 dagene. Lengden på MA som skal brukes avhenger av handelsmålene, med kortere MAs som brukes til kortvarig handel og langsiktig MAs mer egnet for langsiktige investorer 200-dagers MA er mye etterfulgt av investorer og handelsmenn, med pauser over og under denne bevegelige gjennomsnittskonsekvensen oppnås å være viktige handelssignaler. MA'er gir også viktige handelssignaler alene eller når to gjennomsnitt krysser over. En stigende MA indikerer at sikkerheten er i en uptrend, mens en fallende MA indikerer at den er i en downtrend. På samme måte er oppadgående momentum bekreftet med en bullish crossover som oppstår når en kortsiktig MA krysser over en langsiktig MA Nedadgående momentum er bekreftet med en bearish crossover, som oppstår når en kortsiktig MA krysser under en langsiktig MA. Tenk deg at du har data på priser for mange produkter. For hver av produktene registrerer du ukentlig prisinformasjon. Klart sett obs 200.gen prodid n. Hvert produkt har en unik gjennomsnittsprisgenerator. 5 7. Du har data på ukentlige priser i 200 uker, utvider 200 bysort prodid generasjons etikett hver uke. Det er også noen sesongvariasjoner som er sesongmessige 2 sint pi t 50. I tillegg til en generell tidsutviklingsgenerasjon t 005. Den første observasjonen er ikke korrelert med noe genprisprodrice 2 5 trend rpoisson 10 10 hvis t 1 erstatte prisprosess 2 trend sesongmessig 7 pris n-1 3 rpoisson 10 10 hvis t 2 erstatte pris prodprice trend sesongmessig 5 pris n-1 2 pris n-2 3 rpoisson 10 10 hvis t 3 erstatte pris prodprice trend sesongmessig 3 pris n-1 2 pris n - 2 2 pris n-3 3 rpoisson 10 10 hvis t 4 erstatte pris prodprice trend sesong 3 pris n-1 175 pris n-2 125 pris n-3 1 pris n-4 3 rpoisson 10 10 hvis t 4. Lag en globabl til lagre global twograph. forv i 1 6 global twograph line pris t hvis prodid i. twoway twograph, legend off title Sann prisutvikling for første seks produkter. La oss nå forestille oss at de ovennevnte dataene er den sanne prisinformasjonen som er fundamentalt uobservabel. I stedet har du flere samlinger av data per uke på priser som hver avhenger av noen tilfeldig tilleggs feil, utvider 3.bysort prodid t gen prodobs n. gen prisinnsamlingspris normal 25. Men prisinformasjonen du har har noen oppføringer som 10 har vært feilaktig inngikk feil. gen entryerror rbinomial 1, 1 gen scalarerror normal 1.gen priceobs pricecollect 1 entryerror scalarerror label var priceobs Registrert pris. I tillegg ble 35 av dine prisdata aldri samlet gen mangler rbinomial 1, 35.drop hvis du mangler 1. Lag en globabl for å lagre global twograph. forv i 1 6 globale twograph line priceobs t hvis du er prodobs 1.twoway twograph, legend av tittel Observerte prisutviklinger for første seks produkter. Åpen t priceobs prodid entryerror Jeg holder oppføring feil i datasettet som et middel til sammenligning, selv om det ikke ville bli observert direkte. Spørsmålet er. Kan du nå med denne rotete data gjenopprette prisdata som ligner på originalen. Det første vi skal utnytte er duplikatet registrert data. scatter priceobs t hvis prodid 1, tittel Det er enkelt å se individuelle avvik. Det er enkelt å se individuelle avvik, men vi ønsker ikke å gå gjennom alle 200 produktene for å identifisere individuelle prisutviklere. Vi ønsker å komme opp med et system for å identifisere avvikere. La oss generere en gjennomsnittlig etter produkt og tidsforkortelse for å skaffe seg egen prisverdig gjennomsnittlig prisobs. La s flagg enhver observasjon som er 120 større enn gjennomsnittet eller 80 mindre enn den gjennomsnittlige genflaggprisen Prisen 1 2 Prisfastsatte prisobs 8. La oss se hvordan det fungerer to scatter priceobs t hvis prodid 1 scatter priceobs t hvis prodid 1 flagg 1 msymbol lgx tittel Noen av outliers kan identifiseres bare å se på den gjennomsnittlige legenden off. corr flag entryerror Vårt flagg er korrelert med 45 med inngangsfeilene Dette er bra, men vi kan gjøre det bedre. Jeg foreslår det i stedet for å bruke bare det gjennomsnittet at vi bygger et flytende gjennomsnitt av priser og se hvordan hver oppføring avviker fra gjennomsnittet. Det eneste problemet er at den bevegelige gjennomsnittskommandoen krever xtset og det krever bare én oppføring per tidsperiode. Så sier jeg vi rescale tidsvariabelen og legge inn som om det var registrert på en annen tid i uken observasjonsnummeret. Vi trenger å generere prodobs siden vi ikke vet hvilken observasjon som mangler fra hvert produkt, ved hjelp av prodobtegener prodobs n. gen t2 t 4 prodobs. xtset setter panelets datapanel id og tidsserienivå xtset prodid t2. Kommandoen vi skal bruke er tssmooth. Det er kodet slik at ved å spesifisere ma betyr det å flytte gjennomsnitt og vinduet forteller Stata hvor mange tidsperioder som skal telle fremover, og hvor mange bak i flytteflyvningen. Denne kommandoen kan ta litt tid, men det er et stort antall kartriceobs, vinduet 23 0 23 23 er inne effekt 5 uker fremover og 5 uker bak 0 forteller stata å ikke inkludere seg selv i det gjennomsnittet. Det bevegelige gjennomsnittet to scatter-priser t hvis prodid 1-linjen kartriceobs t hvis prodid 1-linjen pricemean t hvis prodid 1-tittelen Moving Average er mindre vellykket for outliers. Det bevegelige gjennomsnittet er stabilere enn bare tidsgjenomsnittet. La oss prøve å flagge ved hjelp av glidende gjennomsnittlig cap-dråpe flagg 2 flagg2 mapriceobs priceobs 1 2 mapriceobs priceobs 8.two scatter priceobs t hvis prodid 1 scatter priceobs t hvis prodid 1 flag2 1 msymbol lgx tittel Moving Average kan også være nyttig legend off. corr flag2 entryerror. Slett vår flaggede datafald hvis flagg 2. 1. Skjul til det ukentlige nivået kollaps prisobs, ved hjelp av etiketten var priceobs Gjennomsnittlig pris observert. forv i 1 6 global twograph scatter prisobs t hvis prodid i. twoway twograph, legenden av tittel Observerte prisutviklinger for første seks produkter Dataene ser mye bedre ut, men vi har fortsatt tydeligvis noen uønskede utelukkere. Vi kan dra nytte av kryssprodukttrendene for å hjelpe til med å identifisere utjevninger innenfor produktprisene ved å redusere egenkapitalprisen, medregnet prisobs. Prisobs aveprice hvis prodid 1 forutsier resid1, residual. reg priceobs aveprice hvis prodid 2 forutsier resid2, restual. reg priceobs aveprice hvis prodid 3 forutsi resid3, residual. twoway line resid1 t hvis prodid 1 linje priceobs t hvis prodid 1 linje resid2 t hvis prodid 2 line priceobs t hvis prodid 2 line resid3 t hvis prodid 3 line priceobs t hvis prodid 3 tittel Residensene er klare indikatorer på outliers legende av. Til slutt, la oss slippe observasjoner med residualer som er større enn 1 5 standardavvik fra gjennomsnittet. qui forv i 1 200 reg priceobs aveprice hvis prodid jeg forutsier resttemp, rest sum resttemp erstatte flagg residtemp-r gjennomsnittlig r sd 1 5 residtemp-r gjennomsnittlig dråpe resttemp. La oss se hvordan det virker to scatter priceobs t hvis prodid 2 scatter priceobs t hvis prodid 2 flagg 1 msymbol lgx tittel Nå prøver jeg bare å fjerne noen endelige utelukkende legenden av. Plotting produkt 1 prissetting i forhold til avvikere global twograph. forv i 1 6 global twograph line priceobs t hvis prodid i. Endelig slippe utjevnene slipp hvis flagg. En siste graf global twograph. forv i 1 6 global twograph scatter priceobs t hvis prodid i. twoway twograph, legend off title Observerte prisutviklinger for første seks produkter. Ikke så rent som vår første graf, men definitivt mye bedre. Gjennomgang av gjennomsnitt. Gjennomsnittlig gjennomsnitt. Med konvensjonelle datasett er gjennomsnittsverdien ofte den første og en av de mest nyttige, oppsummeringsstatistikkene for å beregne når data er i form av en tidsserie , seriens gjennomsnitt er et nyttig mål, men reflekterer ikke dataens dynamiske natur. Gjennomsnittlige verdier som beregnes over kortere perioder, enten i forkant av den nåværende perioden eller sentrert i den nåværende perioden, er ofte mer nyttige. Fordi slike middelverdier vil variere, eller Flytt, da den nåværende perioden beveger seg fra tid t 2, t 3 osv., er de kjent som bevegelige gjennomsnitt. Mas Et enkelt glidende gjennomsnitt er typisk det uveide gjennomsnittet av k tidligere verdier. Et eksponentielt vektet glidende gjennomsnitt er i det vesentlige det samme som et enkelt glidende gjennomsnitt, men med bidrag til gjennomsnittet vektet av deres nærhet til nåværende tid Fordi det ikke er en, men en hel rekke bevegelige gjennomsnitt for en gitt serie, kan settet Mas selv bli plottet på Grafer analysert som en serie, og brukes til modellering og prognoser. En rekke modeller kan konstrueres ved hjelp av bevegelige gjennomsnitt, og disse kalles MA-modeller. Hvis slike modeller kombineres med autoregressive AR-modeller, er de resulterende komposittmodellene kjent som ARMA eller ARIMA modeller jeg er for integrert. Enkelte bevegelige gjennomsnitt. Da en tidsserie kan betraktes som et sett med verdier, kan t 1,2,3,4, n gjennomsnittet av disse verdiene beregnes. Hvis vi antar at n er ganske stor, og vi velger et heltall k som er mye mindre enn n vi kan beregne et sett med blokkmiddelverdier eller enkle bevegelige gjennomsnitt av rekkefølge k. Hver måling representerer gjennomsnittet av dataverdiene over et intervall av k observasjoner. Merk at den første mulig MA i rekkefølge k 0 er det for tk Mer generelt kan vi slippe det ekstra abonnementet i uttrykkene ovenfor og skrive. Dette sier at estimert gjennomsnitt på tidspunktet t er det enkle gjennomsnittet av den observerte verdien ved tid t og foregående k - 1 gangs trinn Hvis vekter er ca. løy som reduserer bidraget til observasjoner som er lengre bort i tid, antas det glidende gjennomsnittet å være eksponensielt glatt. Flytte gjennomsnitt blir ofte brukt som en form for prognoser, hvorved den estimerte verdien for en serie på tiden t 1, S t 1 er tatt som MA for perioden fram til og med tidspunktet teg dagens estimat er basert på et gjennomsnitt av tidligere registrerte verdier fram til og med i går s for daglige data. Enkelte glidende gjennomsnitt kan sees som en form for utjevning I eksemplet illustrert nedenfor er luftforurensningsdatasettet vist i introduksjonen til dette emnet blitt forsterket av en 7-dagers glidende gjennomsnittlig MA-linje, vist her i rødt. Som det kan ses, glir MA-linjen ut toppene og troughene i dataene og kan være veldig hjelpsomme i å identifisere trender Standardforwardberegningsformelen betyr at de første k -1 datapunktene ikke har noen MA-verdi, men deretter utvider beregningene til det endelige datapunktet i serien. PM10 daglige middelverdier, Greenwich. source London Air Quality Network. En grunn til å beregne enkle bevegelige gjennomsnitt på måten som er beskrevet er at det gjør det mulig å beregne verdier for alle tidsluker fra tid tk frem til i dag, og som en ny måling oppnås for tid t 1, vil MA for tid t 1 kan legges til settet som allerede er beregnet Dette gir en enkel prosedyre for dynamiske datasett. Det er imidlertid noen problemer med denne tilnærmingen. Det er rimelig å argumentere for at gjennomsnittverdien i løpet av de siste 3 periodene skal være plassert i tide t -1, ikke tid t og for en MA over et jevnt antall perioder, kanskje det skal ligge midt mellom to tidsintervaller. En løsning på dette problemet er å bruke sentrale MA beregninger, der MA ved tid t er gjennomsnittet av et symmetrisk sett med verdier rundt t Til tross for de åpenbare verdiene, er denne tilnærmingen ikke vanligvis brukt fordi det krever at data er tilgjengelig for fremtidige hendelser, noe som kanskje ikke er tilfelle. I tilfeller der analysen er helt av en eksisterende serie, bruken av sentrert Mas kan være å foretrekke. Enkelte glidende gjennomsnitt kan betraktes som en form for utjevning, fjerner noen høyfrekvente komponenter i en tidsserie og markerer, men fjerner ikke trender på samme måte som den generelle oppfatningen av digital filtrering. Faktisk er glidende gjennomsnitt en form for lineært filter Det er mulig å bruke en glidende gjennomsnittlig beregning til en serie som allerede har blitt utjevnet, dvs. utjevning eller filtrering av en allerede glatt serie. For eksempel med et glidende gjennomsnitt på rekkefølge 2, kan vi betrakte det som beregnet ved bruk av vekter, så MA i x 2 0 5 x 1 0 5 x 2 På samme måte har MA ved x 3 0 5 x 2 0 5 x 3 Hvis vi bruker et andre nivå av utjevning eller filtrering, har vi 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 dvs. 2-trinns filtreringsprosessen eller konvolusjonen har produsert en variabelt vektet symmetrisk bevegelse gjennomsnittlig, med vekter Flere konvolutter kan produsere ganske komplekse vektede glidende gjennomsnitt, hvorav noen har vært fou nd av spesiell bruk i spesialiserte felt, for eksempel i livsforsikringsberegninger. Gjennomgang av gjennomsnitt kan brukes til å fjerne periodiske effekter dersom det beregnes med periodikkets lengde som kjent. For eksempel med månedlige data kan sesongvariasjoner ofte fjernes dersom dette er Målet ved å bruke et symmetrisk 12-måneders glidende gjennomsnitt med alle månedene vektet likt, bortsett fra det første og det siste som veies med 1 2 Dette skyldes at det vil være 13 måneder i den symmetriske modellen nåværende tid, t - 6 måneder Totalt er delt med 12 Lignende prosesser kan vedtas for en veldefinert periodicitet. Eksponentielt vektet glidende gjennomsnitt EWMA. Med den enkle glidende gjennomsnittlige formel. Alle observasjoner er likevektede. Hvis vi kalte disse likevektene, ville hver av k-vektene være 1 k så summen av vektene ville være 1, og formelen ville være. Vi har allerede sett at flere applikasjoner av denne prosessen resulterer i vektene varierende med eksponentielt vektet bevegelse avera gis bidraget til gjennomsnittsverdien fra observasjoner som er fjernet i tid, blir overvekt redusert, og legger dermed vekt på nyere lokale hendelser. I hovedsak er en utjevningsparameter, 0 1, innført, og formelen revidert til. En symmetrisk versjon av denne formelen ville være av skjemaet. Hvis vektene i den symmetriske modellen blir valgt som betingelsene i binomial ekspansjonen, vil 1 2 1 2 2q dekke opp til 1, og når q blir stor, vil den omtrentlige normalfordelingen bli tilnærmet. Dette er et skjema av kjernevekting, med binomialet som kjernefunksjon Den to-trinns konvolusjon beskrevet i forrige avsnitt er nettopp dette arrangementet med q 1, som gir vekter. Ved eksponensiell utjevning er det nødvendig å bruke et sett med vekt som summerer til 1 og som reduserer størrelsen geometrisk. Vektene som brukes, er vanligvis av formen. For å vise at disse vektene summerer til 1, vurder utvidelsen av 1 som en serie Vi kan skrive. og utvide uttrykket i parentes ved å bruke binomialformelen 1- xp hvor x 1 og p -1, som gir. Dette gir da en form for vektet glidende gjennomsnitt av skjemaet. Denne summeringen kan skrives som en tilbakevendingsrelasjon som forenkler beregningen sterkt og unngår problemet at vektingsregimet bør strengt være uendelig for vektene til summen til 1 for små verdier av dette, er vanligvis ikke tilfellet Notasjonen som brukes av forskjellige forfattere varierer Noen bruker bokstaven S for å indikere at formelen er i hovedsak en glatt variabel og skrive . Hvorvidt kontrollteori litteraturen ofte bruker Z i stedet for S for eksponentielt vektede eller jevnte verdier, se for eksempel Lucas og Saccucci, 1990, LUC1 og NIST nettsiden for flere detaljer og bearbeidede eksempler. Formlene som er nevnt ovenfor, kommer fra arbeidet av Roberts 1959, ROB1, men Hunter 1986, bruker HUN1 et uttrykk for skjemaet. Det kan være mer hensiktsmessig for bruk i noen kontrollprosedyrer Med 1 er gjennomsnittlig estimat bare dens målte verdi eller verdien av det forrige datapost Med 0 5 er estimatet det enkle glidende gjennomsnittet for nåværende og tidligere målinger. I prognostiseringsmodeller er verdien S t ofte brukt som estimat eller prognoseverdi for neste tidsperiode, dvs. som estimatet for x på tid t 1 Således har vi. Dette viser at prognosen på tidspunktet t 1 er en kombinasjon av det forrige eksponentielt vektede glidende gjennomsnittet pluss en komponent som representerer den veide prediksjonsfeilen, på tidspunktet t. Avdeling av en tidsserie er gitt og en prognose er nødvendig, en verdi for er nødvendig Dette kan estimeres fra eksisterende data ved å evaluere summen av kvadrert prediksjon feil oppnås med varierende verdier for hver t 2,3 angi det første estimatet til å være den første observerte dataværdi, x 1 I kontrollapplikasjoner verdien av er viktig i det er brukt til å bestemme de øvre og nedre kontrollgrensene, og påvirker den gjennomsnittlige kjølelengden ARL som forventes før disse kontrollgrensene brytes under forutsetningen at tidsserien representerer et sett av tilfeldige, identisk distribuerte uavhengige variabler med vanlig varians. Under disse omstendighetene er variansen av kontrollstatistikken Lucas og Saccucci, 1990. Kontrollgrenser vanligvis sett som faste multipler av denne asymptotiske variansen, f. eks. ganger standardavviket Hvis 0, for eksempel, og dataene som overvåkes antas å ha en Normal fordeling, N 0,1, når det er i kontroll, vil kontrollgrensene være - 1 134 og prosessen vil nå en eller annen grense i 500 trinn i gjennomsnitt Lucas og Saccucci 1990 LUC1 utlede ARLene for et bredt spekter av verdier og under ulike forutsetninger ved bruk av Markov Chain-prosedyrer. De tabulerer resultatene, inkludert å gi ARLer når gjennomsnittet av kontrollprosessen er blitt skiftet av noen flere av standardavvik For eksempel med et 0 5 skifte med 0 25 er ARL mindre enn 50 trinn. Tilnærmingene beskrevet ovenfor er kjent som enkelt eksponensiell utjevning som prosedyrene er ap plutses en gang til tidsseriene, og deretter blir analyser eller kontrollprosesser utført på det resulterende glatte datasettet. Hvis datasettet inneholder en trend - eller sesongkomponent, kan to - eller tre-trinns eksponensiell utjevning brukes som et middel til å fjerne eksplisitt modellering av disse Effekter se nærmere, avsnittet om prognose nedenfor, og NIST-arbeidet. CHA1 Chatfield C 1975 Analysen av Times Series Theory and Practice Chapman og Hall, London. HUN1 Hunter J S 1986 Det eksponentielt vektede glidende gjennomsnitt J av Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Eksponentielt vektede Flytte gjennomsnittlige kontrollsystemer Egenskaper og forbedringer Technometrics, 32 1, 1-12. ROB1 Roberts S W 1959 Kontrolldiagramtester basert på geometriske bevegelige gjennomsnitt Technometrics, 1, 239-250.

No comments:

Post a Comment