Thursday 1 June 2017

Correlações Pearson Em Stata Forex


O que importa pode ser medido, então continue refinando suas medidas. - Ed Seykota No mundo das finanças, a correlação é uma medida estatística de como dois títulos se movem em relação uns aos outros. As correlações são usadas no gerenciamento avançado de portfólio. Evite negociações simultâneas em instrumentos altamente correlacionados Encontre oportunidades de negociação entre instrumentos altamente correlacionados A correlação é positiva quando dois títulos aumentam de preço em conjunto A correlação é negativa quando uma segurança aumenta e a outra diminui. O indicador de correlação de PZ mede de como diferentes títulos se movem em relação a uma referência Um, tornando o gerenciamento de portfólio mais fácil. Um coeficiente de zero é uma correlação neutra Um coeficiente de 0,3 é baixa correlação positiva Um coeficiente sobre 0,8 é alta correlação positiva O coeficiente de -0,3 é baixa correlação negativa O coeficiente sobre -0,8 é alta correlação negativa Melhore seu risco e gerenciamento de portfólio com o melhor E indicador de correlação de mercado mais completo para a plataforma metatrader. ScreenshotsPearsons Correlation using Stata Introduction O coeficiente de correlação produto-momento Pearson, muitas vezes reduzido à correlação Pearson ou correlação Pearsons, é uma medida da força e direção da associação que existe entre duas variáveis ​​contínuas. A correlação de Pearson gera um coeficiente chamado coeficiente de correlação de Pearson, denotado como r. Uma correlação Pearsons tenta desenhar uma linha de melhor ajuste através dos dados de duas variáveis, e o coeficiente de correlação de Pearson, r. Indica quão longe todos esses pontos de dados são para esta linha de melhor ajuste (ou seja, como os pontos de dados correspondem a este novo modelo de melhor ajuste). Seu valor pode variar de -1 para uma relação linear negativa perfeita para 1 para uma relação linear positiva perfeita. Um valor de 0 (zero) indica que nenhuma relação entre duas variáveis. Por exemplo, você poderia usar uma correlação de Pearsons para entender se existe uma associação entre o desempenho do exame e o tempo gasto na revisão (ou seja, suas duas variáveis ​​seriam o desempenho do exame, medido de 0-100 marcas e o tempo de revisão, medido em horas). Se houvesse uma associação moderada e positiva, poderíamos dizer que mais tempo gasto na revisão estava associado ao melhor desempenho do exame. Alternativamente, você poderia usar uma correlação de Pearsons para entender se existe uma associação entre o período de desemprego e a felicidade (ou seja, suas duas variáveis ​​seriam o período de desemprego, medido em dias e a felicidade, medida usando uma escala contínua). Se houvesse uma associação forte e negativa, poderíamos dizer que quanto maior o período de desemprego, maior a infelicidade. Neste guia, mostramos como realizar uma correlação Pearsons usando o Stata, bem como interpretar e relatar os resultados desse teste. No entanto, antes de apresentá-lo a este procedimento, você precisa entender os diferentes pressupostos que seus dados devem atender para que uma correlação Pearsons lhe dê um resultado válido. Nós discutimos estes pressupostos a seguir. Pressupostos Existem quatro pressupostos que sustentam uma correlação Pearsons. Se qualquer um desses quatro pressupostos não for cumprido, analisar seus dados usando uma correlação Pearsons pode não levar a um resultado válido. Como a suposição 1 diz respeito à sua escolha de variáveis, não pode ser testado para usar o Stata. No entanto, você deve decidir se seu estudo atende a essa hipótese antes de seguir em frente. Assunção 1: Suas duas variáveis ​​devem ser medidas no nível contínuo. Exemplos de tais variáveis ​​contínuas incluem altura (medida em pés e polegadas), temperatura (medida em degC), salário (medido em dólares norte-americanos), tempo de revisão (medido em horas), inteligência (medida usando o escore de QI), tempo de reação Em milissegundos), o desempenho do teste (medido de 0 a 100), as vendas (medidas em número de transações por mês), e assim por diante. Se você não tem certeza se suas duas variáveis ​​são contínuas (ou seja, medidas no intervalo ou nível de relação), veja o nosso Guia de Tipos de Variáveis. Nota: Se uma das duas variáveis ​​foi medida em uma escala ordinal. Você precisa usar a correlação de Spearmans em vez da correlação de Pearsons. Exemplos de variáveis ​​ordinais incluem escalas de Likert (por exemplo, uma escala de 7 pontos de concordância forte para discordar fortemente), entre outras formas de categorias de classificação (por exemplo, uma escala de 5 pontos para medir a satisfação no trabalho, variando de mais satisfeito ao menos satisfeito de 4 - escala de pontos determinando o quão fácil foi navegar num novo site, variando de muito fácil a muito difícil ou uma escala de 3 pontos, explicando o quanto um cliente gostou de um produto, variando de Não muito, de OK, de Sim, muito). Felizmente, você pode verificar os pressupostos 2, 3 e 4 usando o Stata. Ao passar às premissas 2, 3 e 4, sugerimos testá-las nesta ordem porque representa uma ordem em que, se uma violação ao pressuposto não for corrigível, você não poderá mais usar uma correlação Pearsons. Na verdade, não se surpreenda se seus dados falharem em um ou mais desses pressupostos, pois isso é bastante típico quando se trabalha com dados do mundo real, em vez de exemplos de livros didáticos, que geralmente mostram apenas como realizar uma correlação Pearsons quando tudo corre bem . No entanto, não se preocupe, porque mesmo quando seus dados falham em certos pressupostos, muitas vezes há uma solução para superar isso (por exemplo, transformar seus dados ou usar outro teste estatístico em vez disso). Basta lembrar que, se você não verificar se seus dados atendem a essas premissas ou não as testar corretamente, os resultados obtidos ao executar uma correlação Pearsons podem não ser válidos. Assunção 2: precisa haver uma relação linear entre suas duas variáveis. Embora existam várias maneiras de verificar se existe uma correlação de Pearsons, sugerimos criar um diagrama de dispersão usando o Stata, onde você pode traçar suas duas variáveis ​​entre si. Você pode então inspecionar visualmente o diagrama de dispersão para verificar a linearidade. Seu diagrama de dispersão pode parecer algo como um dos seguintes: Se o relacionamento exibido em seu diagrama de dispersão não for linear, você terá que transformar seus dados ou talvez executar uma correlação de Spearmans em vez disso, o que você pode fazer usando o Stata. Assunção 3: Não deve haver valores atípicos significativos. Os outliers são simplesmente pontos de dados únicos dentro de seus dados que não seguem o padrão usual (por exemplo, em um estudo de 100 alunos de pontuação de QI, onde o escore médio foi de 108 com apenas uma pequena variação entre os alunos, um aluno teve uma pontuação de 156, o que É muito incomum, e pode até colocá-la no topo 1 dos escores de QI globalmente). Os seguintes pontos de dispersão destacam o impacto potencial de outliers: Pearsons r é sensível a outliers, que pode ter um efeito muito grande na linha de melhor ajuste e o coeficiente de correlação de Pearson, levando a conclusões muito difíceis em relação aos seus dados. Portanto, é melhor se não existirem valores abertos ou são reduzidos ao mínimo. Felizmente, você pode usar o Stata para detectar possíveis outliers usando diagramas de dispersão. Assunção 4: Suas variáveis ​​devem ser distribuídas aproximadamente normalmente. Para avaliar a significância estatística da correlação de Pearson, você precisa ter uma normalidade bivariada, mas essa suposição é difícil de avaliar, portanto, um método mais simples é mais usado. Isso é conhecido como o teste Shapiro-Wilk de normalidade. O que você pode realizar usando o Stata. Na prática, a verificação dos pressupostos 2, 3 e 4 provavelmente ocupará a maior parte do tempo ao realizar uma correlação Pearsons. No entanto, não é uma tarefa difícil, e a Stata fornece todas as ferramentas que você precisa para fazer isso. Na seção, Procedimento de teste em Stata. Ilustramos o procedimento Stata necessário para realizar uma correlação de Pearsons assumindo que nenhum pressuposto foi violado. Primeiro, estabelecemos o exemplo que usamos para explicar o procedimento de correlação Pearsons em Stata. Estudos mostram que o exercício pode ajudar a prevenir doenças cardíacas. Dentro de limites razoáveis, quanto mais você se exercita, menos risco você tem de sofrer de doença cardíaca. Uma maneira pela qual o exercício reduz seu risco de sofrer de doenças cardíacas é reduzindo a gordura no sangue, chamado colesterol. Quanto mais você se exercita, menor sua concentração de colesterol. Além disso, recentemente foi demonstrado que a quantidade de tempo que você gasta assistindo TV ndash um indicador de um estilo de vida sedentário pode ser um bom preditor de doenças cardíacas (isto é, quanto mais TV você assiste, maior o risco de doença cardíaca ). Portanto, um pesquisador decidiu determinar se a concentração de colesterol estava relacionada com o tempo gasto assistindo TV em homens saudáveis ​​de 45 a 65 anos de idade (uma categoria de pessoas em risco). Por exemplo, à medida que as pessoas passaram mais tempo assistindo TV, a concentração de colesterol também aumentou (uma relação positiva) ou ocorreu o contrário. Para realizar a análise, o pesquisador recrutou 100 participantes masculinos saudáveis ​​com idade entre 45 e 65 anos. A quantidade de tempo gasto assistindo TV (ou seja, a variável, timetv) e a concentração de colesterol (isto é, a variável, colesterol) foram registradas para todos os 100 participantes. Expresso em termos variáveis, o pesquisador queria correlacionar colesterol e timetv. Nota: O exemplo e os dados utilizados para este guia são fictícios. Acabamos de criá-los para os propósitos deste guia. Configuração em Stata In Stata, criamos duas variáveis: (1) timetv. Qual é o tempo diário médio gasto assistindo TV em minutos e (2) colesterol. Que é a concentração de colesterol em mmolL. Nota: Não importa qual variável você crie primeiro. Depois de criar essas duas variáveis, ndash timetv e cholesterol ndash, inserimos as pontuações para cada uma nas duas colunas da planilha do Editor de Dados (Editar) (ou seja, o horário em horas que os participantes assistiram TV na coluna da esquerda (ou seja timetv) E participantes da concentração de colesterol em mmolL na coluna da direita (ou seja, o colesterol)), conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Procedimento de teste em Stata Nesta seção, mostramos como analisar seus dados usando uma correlação Pearsons em Stata quando os quatro pressupostos na seção anterior, Suposições. Não foram violados. Você pode realizar uma correlação Pearsons usando código ou interface gráfica do usuário Statas (GUI). Depois de ter realizado sua análise, mostramos como interpretar seus resultados. Primeiro, escolha se deseja usar o código ou a interface gráfica do usuário Statas (GUI). O código básico para executar uma correlação Pearsons assume a forma: pwcorr VariableA VariableB No entanto, se você também deseja que o Stata produza valor-ap (ou seja, o nível de significância estatística do seu resultado), você precisa adicionar sig ao final do código, Como mostrado abaixo: pwcorr VariableA VariávelB, sig Se você também deseja que a Stata lhe informe se seu resultado é estatisticamente significativo em um determinado nível (por exemplo, onde p lt .05), você pode definir este valor p, adicionando-o ao final Do código (por exemplo, (.05) onde p lt .05 ou (.01) onde p lt .01), precedido por sig star (eg sig star (.05)), que coloca uma estrela ao lado da pontuação de correlação se Seu resultado é estatisticamente significativo nesse nível. O código assumiria a forma: pwcorr VariableA VariávelB, sig star (.05) Finalmente, se você deseja que o Stata exiba o número de observações (ou seja, seu tamanho de amostra, N), você pode fazer isso adicionando obs ao final do Código como mostrado abaixo: pwcorr VariableA VariávelB, sig star (.05) obs O código que você escolher incluir deve ser inserido na caixa abaixo: Publicado com permissão por escrito da StataCorp LP. Usando nosso exemplo, onde uma variável é colesterol e a outra variável é timetv. O código necessário seria um dos seguintes: pwcorr colesterol timetv pwcorr colesterol timetv, sig pwcorr colesterol timetv, sig star (.05) pwcorr colesterol timetv, sig star (.05) obs Como queríamos incluir (a) o coeficiente de correlação (B) o valor p no nível .05 e (c) o tamanho da amostra (ou seja, o número de observações), bem como (d) sendo notificado se nosso resultado foi estatisticamente significativo no nível .05, nós inserimos O código, pwcorr colesterol timetv, sig star (.05) obs. E pressionou o botão ReturnEnter no nosso teclado, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Você pode ver a saída da Stata que será produzida aqui. Interface de usuário gráfica (GUI) As três etapas necessárias para realizar uma correlação de Pearsons em Stata 12 e 13 são mostradas abaixo: Clique em S tatistics gt Sumários, tabelas e testes gt Resumo e estatística descritiva g. Correlações em pares no menu principal, como mostrado Abaixo: Publicado com permissão por escrito da StataCorp LP. Você receberá a seguinte caixa de diálogo de correlação de variáveis ​​pwcorr - Pairwise: Publicado com permissão por escrito da StataCorp LP. Selecione colesterol e timetv dentro da caixa Variáveis: (deixe vazio para todos), usando o botão. Em seguida, marque o número de observações de impressão para cada entrada. Nível de significância de impressão para cada entrada e nível de significância para exibir com caixas de estrelas. Você terminará com a seguinte tela: Publicado com permissão por escrito da StataCorp LP. Nota: Não importa em qual ordem você seleciona suas duas variáveis ​​dentro da caixa Variáveis: (deixe vazio para todos). Saída de uma correlação Pearsons em Stata Se seus dados passaram a suposição 2 (ou seja, houve uma relação linear entre suas duas variáveis), a hipótese 3 (ou seja, não houve outliers significativos) e a suposição 4 (ou seja, suas duas variáveis ​​foram distribuídas aproximadamente normalmente) Que explicamos anteriormente na seção Suposições, você só precisará interpretar a seguinte saída de correlação Pearsons em Stata: Publicado com permissão por escrito da StataCorp LP. A saída contém três importantes dados: (1) o coeficiente de correlação de Pearson (2) o nível de significância estatística e (3) o tamanho da amostra. Essas três informações são explicadas em mais detalhes abaixo: (1) O coeficiente de correlação de Pearson, r. Que mostra a força e direção da associação entre suas duas variáveis, colesterol e timetv: Isso é mostrado na primeira linha da caixa vermelha. No nosso exemplo, o coeficiente de correlação de Pearson, r. É .3709. Como o sinal do coeficiente de correlação de Pearson é positivo, você pode concluir que existe uma correlação positiva entre a concentração de colesterol (colesterol) e o tempo diário gasto com a TV (timetv), a concentração de colesterol aumenta à medida que o tempo gasto assistindo TV aumenta. Nota: Alguns se opõem à descrição, a concentração de colesterol aumenta com o tempo gasto assistindo TV aumenta. O motivo dessa objeção está enraizado no sentido de aumentos. O uso deste verbo pode sugerir que o efeito desta variável é causal e ou manipulável, de modo que você possa aumentar o tempo gasto assistindo TV (timetv) em seus participantes, o que levaria a um aumento na concentração de colesterol (colesterol). Isso não quer dizer que isso não seja possível. No entanto, esse conhecimento não está contido na correlação, mas, teoricamente. Como tal, você pode preferir declarar o relacionamento, valores maiores de concentração de colesterol estão associados a um maior tempo gasto assistindo TV. A magnitude do coeficiente de correlação de Pearson determina a força da correlação. Embora não existam regras rígidas para atribuir força de associação a valores específicos, algumas diretrizes gerais são fornecidas por Cohen (1988): Força da Associação onde r significa o valor absoluto ou r (eg r gt .5 significa r gt .5 e r lt -.5). Portanto, o coeficiente de correlação de Pearson neste exemplo (r .371) sugere uma correlação de força média. Se ao invés, r -.371, você também teria uma correlação de força média, embora negativa. O coeficiente de determinação é a proporção de variância em uma variável que é explicada pela outra variável e é calculada como o quadrado do coeficiente de correlação (r 2). Neste exemplo, você tem um coeficiente de determinação, r 2. igual a 0,371 2 0.14. Isso também pode ser expresso como uma porcentagem (ou seja, 14). Lembre-se que este explicado se refere a ser explicado estatisticamente, não causalmente. (2) O nível de significância estatística (ou seja, o valor de p), e se o teste é estatisticamente significativo, uma estrela () ao lado do coeficiente de correlação de Pearsons: Isso é mostrado na segunda linha da caixa vermelha. Os resultados que você relatou até agora usaram o coeficiente de correlação de Pearson para descrever a relação entre as duas variáveis ​​em sua amostra. Se você deseja testar hipóteses sobre a relação linear entre suas variáveis ​​na população de sua amostra, você precisa testar o nível de significância estatística. O nível de significância estatística (p-valor) do coeficiente de correlação neste exemplo é .0001, o que significa que há uma relação estatisticamente significativa entre as duas variáveis: concentração de colesterol (colesterol) e tempo diário passado assistindo TV (timetv). (3) O tamanho da amostra, n (isto é, o número de observações): esta é mostrada na terceira linha da caixa vermelha, indicando que temos 100 participantes em nosso estudo. Nota: Apresentamos a saída da correlação Pearsons acima. No entanto, como você deve ter testado seus dados para os pressupostos que explicamos anteriormente na seção Suposições, você também precisará interpretar a saída do Stata que foi produzida quando você testou esses pressupostos. Isso inclui: (a) os diagramas de dispersão que você usou para verificar se houve uma relação linear entre suas duas variáveis ​​(ou seja, Assunção 2) (b) os mesmos diagramas de dispersão que você usou para verificar não houve valores aberrantes significativos (ou seja, Assunção 3) E (c) o teste Shapiro-Wilk de normalidade para verificar se suas duas variáveis ​​foram aproximadamente normalmente distribuídas (ou seja, Assunção 4). Além disso, lembre-se de que, se seus dados falharam em qualquer um desses pressupostos, a saída que você obtém do procedimento de correlação Pearsons (ou seja, o resultado que discutimos acima) não será mais relevante e você deve ter que realizar um teste estatístico diferente para analisar seus dados. Relatando a saída de uma correlação Pearsons Quando você relata a saída de sua correlação Pearsons, é uma boa prática incluir: A. Uma introdução à análise que você realizou. B. Informações sobre sua amostra (incluindo quaisquer valores faltantes). C. O coeficiente de correlação de Pearson, r. E graus de liberdade, que é o tamanho da amostra menos 2 (por exemplo, para um tamanho de amostra de 100, os graus de liberdade seriam 98. como em nosso exemplo). D. O nível de significância estatística (ou seja, p - value) do seu resultado. E. O coeficiente de determinação, r2 (isto é, a proporção de variância em uma variável que é explicada pela outra variável). Com base nos resultados acima, podemos relatar os resultados deste estudo da seguinte forma: uma correlação produto-momento Pearsons foi realizada para avaliar a relação entre a concentração de colesterol e o tempo diário passado assistindo TV em 100 homens entre 45 e 65 anos. Houve uma correlação positiva moderada entre o tempo diário passado assistindo TV e concentração de colesterol, r (98) .371, p lt .0005, com o tempo gasto assistindo a TV explicando 14 da variação na concentração de colesterol. Além de reportar os resultados como acima, um diagrama pode ser usado para apresentar visualmente seus resultados. Por exemplo, você poderia fazer isso usando um scatterplot. Isso pode tornar mais fácil para os outros entender seus resultados e é facilmente produzido na Stata.

No comments:

Post a Comment