Correlação O coeficiente de correlação (um valor entre -1 e 1) indica quão fortemente duas variáveis estão relacionadas entre si. Podemos usar a função CORREL ou o suplemento Analysis Toolpak no Excel para encontrar o coeficiente de correlação entre duas variáveis. - Um coeficiente de correlação de 1 indica uma correlação positiva perfeita. À medida que a variável X aumenta, a variável Y aumenta. À medida que a variável X diminui, a variável Y diminui. - Um coeficiente de correlação de -1 indica uma correlação negativa perfeita. À medida que a variável X aumenta, a variável Z diminui. À medida que a variável X diminui, a variável Z aumenta. - Um coeficiente de correlação próximo de 0 indica que não há correlação. Para usar o suplemento Analysis Toolpak no Excel para gerar rapidamente coeficientes de correlação entre múltiplas variáveis, execute as seguintes etapas. 1. Na guia Dados, clique em Análise de dados. Nota: não consigo encontrar o botão Análise de dados Clique aqui para carregar o complemento Analysis ToolPak. 2. Selecione Correlação e clique em OK. 3. Por exemplo, selecione o intervalo A1: C6 como a faixa de entrada. 4. Verifique as etiquetas na primeira linha. 5. Selecione a célula A9 como o intervalo de saída. Conclusão: as variáveis A e C estão positivamente correlacionadas (0,91). As variáveis A e B não estão correlacionadas (0,19). As variáveis B e C também não estão correlacionadas (0.11). Você pode verificar essas conclusões observando o gráfico. Suponha que você tenha N séries de tempo (classe xts). Você pode sugerir uma maneira (por exemplo, uma função existente) para calcular a correlação média de rolamento (janela de rolagem). Então, você tem (por exemplo) 10 séries temporais. O primeiro passo é calcular 60 dias de correlação entre primeiro e segundo, primeiro e terceiro, primeiro e quarto, e assim por diante. O segundo passo é calcular a média desse valor de correlação. Fim do primeiro ciclo. Depois de avançar um dia e começar todo o processo (primeiro e segundo passo), os resultados são uma série temporal com valores de correlação médios. Alguém pode ajudar a encontrar uma maneira eficiente de fazer isso Esta é a estrutura dos meus dados: Suponha que você tenha todas as séries no quadro de dados chamado X, nas primeiras dez variáveis. Então: se você não possui um quadro de dados, acho que o caminho mais fácil é primeiro criar um quadro de dados :) - desde que suas séries temporais tenham o mesmo comprimento. Para excluir a diagonal 1s da matriz de correlação, você pode primeiro definir uma função que calcula a média de todos os valores abaixo da diagonal (ou acima do diag, doenst fazem a diferença): (Não testado, mas acho que é um shoudlwork) é a correlação da amostra entre X e Y No tempo t. É a covariância ponderada exponencial de amostra entre X e Y no instante t. É a amostra de volatilidade ponderada exponencial para a série temporal X no tempo t. É a volatilidade ponderada exponencial da amostra para a série temporal Y no tempo t. É o fator de suavização usado nos cálculos de volatilidade ponderada exponencial e covariância. Se os conjuntos de dados de entrada não tiverem um significado zero, a função EWXCF Excel remove a média de cada amostra de dados em seu nome. O EWXCF usa a volatilidade do EWMA e as representações EWCOV que não assumem uma volatilidade média (ou covariância) de longo prazo e, portanto, para qualquer horizonte de previsão além de um passo, o EWXCF retorna um valor constante. Referências Hull, John C. Opções, Futuros e Outros Derivados Financial Times Prentice Hall (2003), pp 385-387, ISBN 1-405-886145 Hamilton, J. D. Análise de séries temporais. Princeton University Press (1994), ISBN 0-691-04289-6 Tsay, Ruey S. Análise da série temporária financeira John Wiley amp SONS. (2005), ISBN 0-471-690740 Links relacionados
Комментариев нет:
Отправить комментарий