Saturday 12 August 2017

Pooled Regression In Stata Forex


Calculadora de Tamanho de Efeito Calculadora de Tamanho de Efeito: um guia do usuário para usar a planilha: A Calculadora de Tamanho de Efeito é uma planilha do Microsoft Excel. Ele é executado na versão 5 ou posterior (incluindo o Office95). Se você digitar a média, o número de valores eo desvio padrão para os dois grupos que estão sendo comparados, calculará o Tamanho do Efeito para a diferença entre eles e mostrará essa diferença (e seu intervalo de confiança) em um gráfico. Também irá calcular o teste-t padrão para comparar dois meios para ver se a diferença é estatisticamente significativa. A planilha é composta por duas folhas: Calculadora. Em que os dados são inseridos e os valores calculados, e Gráfico. Que traça a estimativa do tamanho do efeito e seus intervalos de confiança. Clique nas guias na parte inferior da tela para alternar entre elas. Calculadora Esta folha é dividida em três seções: 1. ENTRADA DE DADOS (colunas A a G) Esta seção contém as células nas quais os dados podem ser inseridos. Não altere o conteúdo de qualquer célula que esteja sombreada. Digite somente em células em branco, caso contrário fórmulas importantes podem ser perdidas. Digite um rótulo curto para cada medida de resultado inserida. O conteúdo das células A4 a A7 é usado como os rótulos para as estimativas de tamanho de efeito no Gráfico. Grupo de tratamento: média Introduzir a média para o grupo de tratamento. Esta é a estimativa agrupada de desvio padrão de ambos os grupos, com base no pressuposto de que qualquer diferença entre as suas SD é apenas devido à variação da amostragem. P-valor para a diferença em SDs Este é o p-valor para um F-teste de se os seus SDs são suficientemente perto para diferir apenas por acaso. É a probabilidade de que uma diferença tão grande como esta teria ocorrido se as amostras fossem tiradas da mesma população. Convencionalmente, valores inferiores a 0,05 são tomados para lançar dúvidas sobre esta suposição. Esta é simplesmente a diferença entre os dois meios. Se o resultado for medido numa escala familiar, esta diferença é interpretável como o tamanho do efeito. P-valor para o diff médio (teste T de 2 caudas) Este é o valor de p para um teste-T padrão de se os dois meios estão próximos o suficiente para diferir apenas por acaso. É a probabilidade de que uma diferença tão grande como esta teria ocorrido se as amostras fossem tiradas da mesma população. Convencionalmente, os valores inferiores a 0,05 são tomados para lançar dúvidas sobre esta suposição, ou seja, se p lt 0,05, a diferença é improvável que tenha surgido por acaso e é dito ser estatisticamente significativa. Intervalo de confiança para a diferença: menor O intervalo de confiança é uma forma alternativa de indicar a variabilidade nas estimativas a partir de pequenas amostras. O cálculo padrão aqui é um intervalo de confiança de 95 (outras porcentagens podem ser dadas alterando o valor na célula W10). Se várias amostras de dois grupos do mesmo tamanho, retirados de uma população em que a verdadeira diferença era o valor na coluna J, haveria variação nas diferenças encontradas. No entanto, para cada 100 amostras colhidas, para 95 delas (em média) a diferença seria entre os limites de confiança inferior e superior. O intervalo de confiança é normalmente interpretado como uma margem de incerteza em torno da estimativa da diferença entre os grupos experimentais e de controlo. Intervalo de confiança para a diferença: superior 3. TAMANHO DE EFEITO PADRONIZADO (colunas N a S) Esta seção calcula a diferença entre os dois grupos como um tamanho de efeito padronizado, corrige-o para viés e calcula um intervalo de confiança. Tamanho do efeito baseado no grupo de controlo SD Em alguns casos pode não ser apropriado utilizar uma estimativa agrupada de desvio padrão, pelo que o grupo de controlo SD é utilizado. As fórmulas para calcular essas estatísticas foram coladas em dez linhas da planilha (ou seja, linhas 4 a 13). Se você quiser calcular mais de dez tamanhos de efeito, as fórmulas podem ser copiadas em linhas adicionais. A maneira mais fácil de fazer isso é selecionar primeiro as células que contêm a linha inferior com as fórmulas já existentes e as linhas nas quais você deseja colá-las. Por exemplo, se você desejar mais cinco linhas, clique na célula H13, arraste para S18 e libere. Em seguida, pressione CTRL D (ie mantenha pressionada a tecla CTRL e pressione e solte D). Gráfico O gráfico traça a estimativa do Tamanho do Efeito (coluna O) e seus limites de confiança (colunas Q e R). Ele usa o texto na coluna A como um rótulo para cada Tamanho de Efeito. Por padrão, o gráfico traça quatro Tamanhos de Efeito, correspondendo aos valores das linhas 4 a 7. Para incluir mais (ou menos) Tamanhos de Efeito, mova o ponteiro sobre um dos diamantes que representa a estimativa de Tamanho de Efeito e clique. O texto SÉRIE (Estimativa do Tamanho do Efeito, CalculadoraA4: A7, CalculadoraO4: O7,1) aparecerá na barra de fórmulas (na parte superior da tela). Se você quiser que apenas dois tamanhos de efeito sejam mostrados, altere os 7s em 5s (para que os valores nas linhas 4 a 5 sejam plotados) e pressione RETURN. Alternativamente, para plotar cinco Tamanhos de Efeito, substitua o 7s por 8s. Em seguida, clique em um dos pontos limites de confiança superior e repita a correção e, novamente, para o limite de confiança mais baixo. Interpretação de resultados estatísticos Resultados Onde os dados são normalmente distribuídos ea variância é conhecida ou desconhecida 13 Sempre que a variância de uma população (2) O teste z é a alternativa preferencial para testar uma hipótese da média populacional (). Para calcular a estatística de teste, o erro padrão é igual ao desvio padrão da população / raiz quadrada do tamanho da amostra. Por exemplo, com uma variância populacional de 64 e um tamanho de amostra de 25, o erro padrão é igual a (64) 1/2 / (25) 1/2. Ou 1,6. 13 Exemplo: Teste de Estatística 13 Suponha que, neste mesmo caso, construímos um teste de hipótese de que o retorno médio anual é igual a 12, isto é, temos um teste de duas colas, onde a hipótese nula é que a população significa 12 e O alternativo é que não é igual a 12. Usando um nível crítico 0.05 (0.025 para cada cauda), nossa regra é rejeitar o nulo quando a estatística de teste está abaixo de -1.96 ou acima de 1.96 (em p .025, z 1.96 ). Suponha que a média da amostra seja 10,6. 13 Resposta: Estatística do teste (10,6-12) / 1,6 -1,4 / 1,6 -0,875. Este valor não cai abaixo do ponto de rejeição, portanto não podemos rejeitar a hipótese nula com certeza estatística. Quando estamos fazendo testes de hipóteses sobre uma média populacional, é relativamente provável que a variância da população seja desconhecida. Nestes casos, usamos um desvio padrão da amostra ao calcular o erro padrão e a estatística t para a regra de decisão (ou seja, como a fonte para o nosso nível de rejeição). Comparado com o z ou padrão normal, uma estatística t é mais conservadora (isto é, pontos de rejeição mais elevados para rejeitar a hipótese nula). Nos casos com grandes tamanhos de amostra (pelo menos 30), a estatística z pode ser substituída. 13 Exemplo: Tome um caso em que o tamanho da amostra seja 16. Nesse caso, o t-stat é a única escolha apropriada. Para a distribuição t, os graus de liberdade são calculados como (tamanho da amostra - 1), df 15 neste exemplo. Neste caso, suponha que estamos testando uma hipótese de que uma média populacional é maior que 8, então este será um teste unilateral (cauda direita): hipótese nula é lt 8 ea alternativa é que gt 8. Nossa significância requerida Nível é 0,05. Usando a tabela para a distribuição de Student t para df 15 e p 0,05, o valor crítico (ponto de rejeição) é 1,753. Em outras palavras, se nossa estatística de teste calculada for maior que 1.753, rejeitamos a hipótese nula. Resposta: Passando para o passo 5 do processo de teste de hipóteses, tomamos uma amostra onde a média é 8,3 eo desvio padrão é 6,1. Para esta amostra, erro padrão s / n 1/2 6.1 / (16) 1/2 6.1 / 4 1.53. A estatística do teste é (8,3 - 8,0) / 1,53 0,3 / 1,53, ou 0,196. Comparando 0,196 com o nosso ponto de rejeição de 1,753, somos incapazes de rejeitar a hipótese nula. 13 Observe-se que neste caso, nossa amostra média de 8,3 foi realmente maior que 8, no entanto, o teste de hipótese é configurado para exigir significância estatística, e não simplesmente comparar uma amostra média com a hipótese. Em outras palavras, as decisões tomadas no teste de hipóteses são também uma função do tamanho da amostra (que em 16 é baixa), o desvio padrão, o nível de significância requerido ea distribuição t. Nossa interpretação neste exemplo é que o 8,3 da média da amostra, embora nominalmente maior do que 8, simplesmente não é significativamente maior do que 8, pelo menos até o ponto em que seríamos capazes de fazer uma conclusão definitiva sobre a média da população maior que 8 13 Igualdade relativa de médias de população de duas populações normalmente distribuídas, onde a amostra aleatória aleatória é considerada igual ou desigual. Para o caso em que as variâncias da população para dois grupos separados podem ser consideradas iguais, uma técnica para reunir uma estimativa da variância da população (S 2) a partir dos dados da amostra é dada pela seguinte fórmula (assume duas amostras aleatórias independentes): 13 Onde: n 1. N 2 são tamanhos de amostras, e s 1 2. s 2 2 são variâncias de amostra. Para testar a igualdade de duas médias de população (ie 1 2), a estatística de teste calcula a diferença nas médias da amostra (X 1 - X 2), dividido pelo erro padrão: a raiz quadrada De (s 2 / n 1 s 2 / n 2). Exemplo: Meios de População Suponha que a estimativa de variância (s 2) combinada foi de 40 e o tamanho da amostra para cada grupo foi 20. Erro padrão (40/20 40/20) 1/2 (80/20) 2. Resposta: Se a amostra As médias foram 8,6 e 8,9, o t (8,6 - 8,9) / 2 -0,3 / 2 -0,15. Os testes de igualdade / desigualdade são testes bilaterais. Com df 38 (soma dos tamanhos das amostras - 2) e se assumimos 0.05 significância (p 0.025), o nível de rejeição é t lt -2.024, ou t gt 2.024. Como nossa estatística de teste calculada foi de -0,15, não podemos rejeitar a hipótese nula de que essas médias de população são iguais. 1. Para testes de hipóteses de igualdade de população, onde as variâncias não podem ser assumidas como sendo iguais, a estatística de teste apropriada para a hipótese é o t-stat, mas não podemos mais juntar uma estimativa de desvio padrão eo erro padrão torna-se o quadrado Raiz de (s 1 2 / n 1) (s 2 2 / n 2). A hipótese nula permanece 1 2. E a estatística de teste é calculada de forma semelhante ao exemplo anterior (isto é, diferença nas médias da amostra / erro padrão). Calculando graus de liberdade é aproximado por esta fórmula 13 Look Out 13 Nota: Não gaste tempo memorizando esta fórmula que não será necessária para o exame. Concentre-se, em vez disso, nas etapas de teste de hipóteses e interpretação de resultados. 13 O Teste de Comparações Comparadas O exemplo anterior testou a igualdade ou desigualdade de duas médias populacionais, com uma suposição chave de que as duas populações eram independentes uma da outra. Em um teste de comparações pareadas, as duas populações têm algum grau de correlação ou co-movimento eo cálculo da estatística de teste leva em conta essa correlação. Considere um caso em que estamos comparando dois fundos mútuos que são classificados como crescimento de grande capitalização, no qual estamos testando se os retornos para um são significativamente acima do outro (estatisticamente significativo). O teste de comparação pareada é apropriado, uma vez que assumimos algum grau de correlação, já que os retornos para cada um dependerão do mercado. Para calcular a estatística t, primeiro encontramos a diferença de média da amostra. Onde d é o número de observações emparelhadas (no nosso exemplo, o número de trimestres para o qual temos retornos trimestrais), e cada d é A diferença entre cada observação na amostra. Em seguida, variância da amostra. Ou (soma de todos os desvios de d) 2 / (n - 1) é calculado, com desvio padrão (s d) a raiz quadrada positiva da variância. Erro padrão s d / (n) 1/2. Para o nosso exemplo mútuo, se os nossos retornos médios são de 10 anos (40 quartos de dados), temos uma média de diferença de amostra de 2,58 e um desvio padrão de amostra de 5,32, nossa estatística de teste é calculada como (2,58) / (5,32) / (40) 1/2), ou 3,067. A 49 graus de liberdade com um nível de significância de 0,05, o ponto de rejeição é 2,01. Assim, rejeitamos a hipótese nula e afirmamos que há uma diferença estatisticamente significativa nos retornos entre esses fundos. Testes de Hipótese sobre a Variância de uma População Normalmente Distribuída Os testes de hipóteses sobre o valor de uma variância (2) começam pela formulação das hipóteses nulas e alternativas. 13 Em testes de hipótese para a variância em uma única população normalmente distribuída, a estatística de teste apropriada é conhecida como um qui-quadrado, denotado por 2. Ao contrário das distribuições que temos usado anteriormente, o qui-quadrado é assimétrico como está ligado em A esquerda por zero. O chi-quadrado é na verdade uma família de distribuições semelhantes às distribuições t, com diferentes graus de liberdade resultando em uma distribuição chi-quadrada diferente. 13 Onde: n tamanho da amostra, s 2 variância da amostra, 0 2 variância da população da hipótese A variância da amostra s 2 é avaliada como a soma dos desvios entre os valores observados ea média da amostra 2. graus de liberdade, ou n - 1 Exemplo: Teste de Hipótese Para ilustrar um teste de hipóteses usando a estatística do qui-quadrado, tome um exemplo de um fundo que acreditamos ter sido muito volátil em relação ao mercado, e queremos provar que o nível de risco (medido pelo padrão trimestral Desvio) é maior que a média dos mercados. Para nosso teste, assumimos que o desvio padrão trimestral do mercado é 10. Nosso teste examinará os retornos trimestrais nos últimos cinco anos, portanto n 20, e graus de liberdade 19. Nosso teste é um teste maior do que com a hipótese nula de 2 Lt (10) 2. ou 100 e uma hipótese alternativa de 2 gt 100. Usando um nível de significância de 0,05, nosso ponto de rejeição, das mesas chi-quadradas com df 19 e p 0,05 na cauda direita, é 30,144. Assim, se a nossa estatística de teste calculada for maior que 30,144, rejeitamos a hipótese nula a 5 nível de significância. Resposta: Examinando os retornos trimestrais para este período, encontramos a nossa variância de amostra (s 2) é 135. Com n 20 e 0 2 100, temos todos os dados necessários para calcular a estatística de teste. 2 ((n - 1) s 2) / 0 2 ((20-1) 135) / 100 2565/100 ou 25,65. Uma vez que 25,65 é menor do que o nosso valor crítico de 30,144, não temos evidências suficientes para rejeitar a hipótese nula. Embora este fundo possa ser bastante volátil, sua volatilidade não é estatisticamente mais significativa do que a média do mercado para o período. Testes de hipóteses relacionados à igualdade das variâncias de duas populações normalmente distribuídas, onde ambas as amostras são aleatórias e independentes Para testes de hipóteses relativos aos valores relativos das variâncias de duas populações - seja 1 2 (variância da primeira população) e 2 2 (variância Do segundo) são iguais / não iguais / maiores que / menos do que - podemos construir hipóteses de uma de três maneiras. 13 Quando um teste de hipóteses compara as variâncias de duas populações e podemos supor que as amostras aleatórias das populações são independentes (não correlacionadas), o teste apropriado é o teste F, que representa a razão das variâncias da amostra. Como com o qui-quadrado, a distribuição-F é uma família de distribuições assimétricas (ligada à esquerda por zero). A família F de distribuições é definida por dois valores de graus de liberdade: o numerador (df 1) eo denominador (df 2). Cada um dos graus de liberdade é retirado do tamanho da amostra (cada tamanho da amostra - 1). O teste F retirado dos dados da amostra pode ser s 1 2 / s 2 2 ou s 2 2 / s 1 2 - com a convenção usar qualquer proporção que produza o maior número. Dessa forma, o teste F só precisa se preocupar com valores maiores que 1, uma vez que uma das duas razões sempre será um número acima de 1. Exemplo: Teste de Hipótese com Razão de Variâncias de Amostra Para ilustrar, tome um caso de Dois fundos mútuos. Fundo A tem desfrutado maior desempenho retorna do que o Fundo B (que weve propriedade, infelizmente). Nossa hipótese é que o nível de risco entre estes dois é realmente bastante semelhante, o que significa que o Fundo A tem melhores resultados ajustados ao risco. Testamos a hipótese para os últimos cinco anos de dados trimestrais (df é 19 para o numerador eo denominador). Usando 0,05 de significância, nosso valor crítico das tabelas F é de 2,51. Assuma a partir da amostra de cinco anos que os desvios-padrão trimestrais foram de 8,5 para o Fundo A e de 6,3 para o Fundo B. Resposta: Nossa estatística F é (8,5) 2 / (6,3) 2 72,25 / 39,69 1,82. Uma vez que 1,82 não atinge o nível de rejeição de 2,51, não podemos rejeitar a hipótese nula, e afirmamos que o risco entre esses fundos não é significativamente diferente. É improvável que os conceitos da seção de teste de hipóteses sejam testados por exercícios rigorosos no cálculo do número, mas sim na identificação dos atributos únicos de uma determinada estatística. Por exemplo, uma pergunta típica poderia perguntar, no teste de hipóteses, qual estatística de teste é definida por dois graus de liberdade, o numerador eo denominador, dando-lhe estas escolhas: A. t-teste, B. z-teste, C. chi - square, ou D. F-teste. Naturalmente, a resposta seria D. Outra pergunta pode ser feita, Qual distribuição NÃO é simétrica e, em seguida, dar-lhe estas escolhas: A. t, B. z, C. chi-quadrado, D. normal. Aqui a resposta seria C. Foco nas características definidoras, pois elas são a fonte mais provável de perguntas do exame. Testes paramétricos e não paramétricos Todos os testes de hipóteses descritos até aqui foram projetados, de uma forma ou de outra, para testar o valor previsto de um ou mais parâmetros - variáveis ​​desconhecidas como média e variância que caracterizam uma população e cujos valores observados estão distribuídos De certo modo assumido. Na verdade, essas suposições específicas são obrigatórias e também muito importantes: a maioria dos testes comumente aplicados são construídos com dados que pressupõem que a população subjacente é normalmente distribuída, o que se não for verdade, invalida as conclusões alcançadas. Quanto menos normal for a população (isto é, quanto mais desviados forem os dados), menos estes testes paramétricos ou procedimentos devem ser utilizados para o fim pretendido. Testes de hipóteses não paramétricas são projetados para casos em que (a) menos ou diferentes suposições sobre os dados da população são apropriados, ou (b) onde o teste de hipótese não se refere a um parâmetro de população. Em muitos casos, estamos curiosos sobre um conjunto de dados, mas acreditamos que as suposições necessárias (por exemplo, dados normalmente distribuídos) não se aplicam a este exemplo, ou então o tamanho da amostra é muito pequeno para confortavelmente fazer tal suposição. Várias alternativas não paramétricas foram desenvolvidas para uso em tais casos. A tabela abaixo indica alguns exemplos que são análogos aos testes paramétricos comuns. 13 Preocupação com a hipóteseDiferença entre variância e desvio padrão Diferença versus desvio padrão A variação é o fenômeno comum no estudo das estatísticas, porque se não houvesse variação em um dado, provavelmente não precisaríamos de estatísticas em primeiro lugar. A variação é descrita como variância nas estatísticas, que é uma medida da distância dos valores da sua média. A variância é pequena ou pequena se os valores forem agrupados mais próximos da média. Desvio padrão é outra medida para descrever a diferença entre os resultados esperados e seus valores reais. Embora ambos estreitamente relacionados, existem diferenças entre variância e desvio padrão que serão discutidos neste artigo. Os valores brutos são sem significado em qualquer distribuição e não podemos deduzir qualquer informação significativa deles. É com a ajuda do desvio padrão que somos capazes de apreciar a importância de um valor como ele nos diz o quão longe estamos a partir do valor médio. A variância é semelhante em conceito ao desvio padrão, exceto que é um valor quadrado de SD. Faz sentido entender os conceitos de variância e desvio padrão com a ajuda de um exemplo. Suponha que haja um fazendeiro cultivando abóboras. Ele tem dez abóboras de diferentes pesos que são os seguintes. 2,6, 2,6, 2,8, 3,0, 3,1, 3,2, 3,3, 3,5, 3,6, 3,8. É fácil calcular o peso médio das abóboras, pois é a soma de todos os valores divididos por 10. Neste caso, é 3,15 libras. No entanto, nenhuma das abóboras pesa tanto e variam em peso, variando de 0,55 quilos mais leve a 0,65 quilos mais pesado do que a média. Agora podemos escrever a diferença de cada valor da média da seguinte maneira -0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65. O que fazer com essas diferenças em relação à média. Se tentarmos encontrar a diferença média, vemos que não podemos encontrar a média como ao somar, valores negativos são iguais a valores positivos ea diferença média não pode ser calculada assim. É por isso que foi decidido quadrado todos os valores antes de somá-los e encontrar a média. Neste caso, os valores quadrados são os seguintes: 0,3025, 0,3025, 0,1225, 0,0225, 0,0025, 0,0025, 0,1225, 0,2025, 0,4225. Agora esses valores podem ser adicionados e divididos por dez para chegar a um valor que é conhecido como variância. Esta variância é 0,1525 libras neste exemplo. Este valor não tem muita importância, pois tínhamos quadrado a diferença antes de encontrar sua média. É por isso que precisamos encontrar a raiz quadrada da variância para chegar ao desvio padrão. Neste caso, é 0,3905 libras. Tanto a variância quanto o desvio padrão são medidas de propagação de valores em qualquer dado. A variância é calculada tomando a média dos quadrados das diferenças individuais da média da amostra. Desvio padrão é a raiz quadrada da variância.

No comments:

Post a Comment