Tuesday 18 December 2018

Exponentiate command in stata forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas e Educação Digital Ajudar o Grupo de Consultoria Estatal, dando um presente Módulo de Aprendizagem Stata Criando e recodificando variáveis ​​Este módulo mostra como criar e recodificar variáveis. Na Stata você pode criar novas variáveis ​​com gerar e você pode modificar os valores de uma variável existente com substituição e com recodificação. Computação de novas variáveis ​​usando gerar e substituir Vamos usar os dados automaticamente para nossos exemplos. Nesta seção, veremos como calcular variáveis ​​com gerar e substituir. O comprimento variável contém o comprimento do carro em polegadas. Abaixo, veremos estatísticas resumidas para o comprimento. Permite usar o comando generate para criar uma nova variável que tenha o comprimento em pés em vez de polegadas, chamado lenft. Devemos enfatizar que gerar é criar uma nova variável. Para uma variável existente, você precisa usar o comando substituir (não gerar). Conforme mostrado abaixo, usamos substituir para repetir a atribuição para lenft. A sintaxe de gerar e substituir é idêntica, exceto: - gerar trabalhos quando a variável ainda não existe e dará um erro se a variável já existir. - substituir obras quando a variável já existe e dará um erro se a variável ainda não existir. Suponhamos que queríamos fazer uma variável chamada length2 que tenha um comprimento quadrado. Ou talvez possamos fazer loglen, que é o log natural do comprimento. Permite obter o desvio padrão médio e o comprimento e podemos fazer escores Z de comprimento. A média é 187,93 e o desvio padrão é 22,27, portanto, o zlength pode ser calculado como mostrado abaixo. Com gerar e substituir você pode usar - para adição e subtração você pode usar para multiplicação e divisão que você pode usar para expoentes (por exemplo, length2) você pode usar () para controlar a ordem das operações. Recodificação de novas variáveis ​​usando gerar e substituir Suponha que queríamos quebrar o mpg em três categorias. Vamos ver uma tabela de mpg para ver onde podemos desenhar as linhas para essas categorias. Permite converter mpg em três categorias para ajudar a tornar isso mais legível. Aqui convertem o mpg em três categorias usando gerar e substituir. Vamos usar tabulações para verificar se isso funcionou corretamente. Na verdade, você pode ver que um valor de 1 para mpg3 vai de 12-18, um valor de 2 vai de 19-23 e um valor de 3 vai de 24-41. Agora, poderíamos usar mpg3 para mostrar uma tabela de crosstag de mpg3 por estrangeiros para contrastar a quilometragem dos carros estrangeiros e domésticos. A tabela de referência acima mostra que 21 dos carros domésticos se enquadram na categoria de alta quilometragem, enquanto 55 dos carros estrangeiros se enquadram nesta categoria. Recodificação de variáveis ​​usando recode Existe uma maneira mais fácil de recodificar mpg para três categorias usando gerar e recodificar. Primeiro, fazemos uma cópia do mpg. Chamando mpg3a. Então, usamos recode para converter o mpg3a em três categorias: min-18 em 1, 19-23 em 2 e 24-max em 3. Vamos verificar duas vezes para ver se isso funcionou corretamente. Vemos que funcionou perfeitamente. Recodes com se permite criar uma variável chamada mpgfd que avalia a quilometragem dos carros em relação à sua origem. Deixe esta ser uma variável de 01 chamada mpgfd, que é: 0 se abaixo da mediana mpg para o seu grupo (domínios estrangeiros) 1 se atabove o mpg médio para o seu grupo (domínios estrangeiros). Nós vemos que a mediana é de 19 para os carros domésticos (estrangeiros) e 24,5 para os carros estrangeiros (estrangeiros1). Os comandos de geração e recomeçamento abaixo recodam o mpg para o mpgfd com base na mediana do carro doméstico para os carros domésticos e com base na mediana do carro estrangeiro para os carros estrangeiros. Podemos verificar usando isso abaixo, e o valor recodificado mpgfd parece correto. Crie uma nova variável que seja comprimento dividido por 12. Mude os valores de uma variável existente chamada lenft. Recode mpg em mpg3. Tendo três categorias usando gerar e substituir se. Recode mpg em mpg3a. Tendo três categorias, 1 2 3, usando gerar e recodificar. Recode mpg em mpgfd. Tendo duas categorias, mas usando diferentes pontos de corte para carros estrangeiros e domésticos. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.7. Os modelos de sobrevivência em Stata Stata possuem amplas instalações para montagem de modelos de sobrevivência. Vamos discutir apenas o uso da regressão de Poisson para se adequar aos modelos de sobrevivência exponencial por partes. 7.5 Mortalidade infantil e infantil na Colômbia A página de conjuntos de dados tem a tabulação original de crianças por sexo, coorte, idade e estado de sobrevivência (morto ou ainda vivo na entrevista), conforme analisado por Somoza (1980). Como é frequentemente o caso dos dados de sobrevivência, uma boa parte do esforço é converter os dados brutos nas contagens de eventos e na exposição necessária para a análise. Preparação de dados Começaremos lendo os dados e colapsando sobre o sexo, e depois calcularemos os eventos e a exposição para reproduzir a Tabela 7.1 nas notas da aula. Certifique-se de que os dados são classificados por coorte e depois idade, use egen para contar o número total de crianças em cada coorte e, em seguida, use substituir com um prefixo de coorte para recalcular o número de crianças vivas no início de cada faixa etária, Calculado como o número que iniciou a faixa etária anterior menos aqueles ainda vivos na faixa etária anterior e menos aqueles que morreram na faixa etária anterior. Tendo feito isso, podemos deixar cair crianças com mais de 10 anos, já que estamos apenas interessados ​​na sobrevivência até os dez anos. O próximo passo é usar recode para gerar uma variável que representa a largura dos intervalos de idade em meses. Em seguida, usamos gerar para calcular a exposição, assumindo que todos estão expostos à largura total do intervalo, exceto aqueles censurados ou que morrem no intervalo, que estão expostos em média metade do intervalo. Nós dividimos em 12 para expressar a exposição em anos-pessoa. Finalmente, listamos os resultados. Por conveniência, mudamos de nome para mortes e definimos um formato para que a exposição seja impressa com uma decimal. Os resultados coincidem com a Tabela 7.1 nas notas. Rotulamos o conjunto de dados e salve-o. O arquivo resultante está disponível na seção de conjuntos de dados como somoza2. Offset e Predictors Em preparação para a modelagem, vamos calcular o logaritmo do tempo de exposição, para ser usado como um deslocamento. Também criaremos as variáveis ​​simuladas usuais para idade e coorte. Nós realmente não precisamos disso, dada a conveniência das variáveis ​​de fatores no Stata 11, mas bem, calcule-os de qualquer maneira para obter uma saída mais bem avaliada Exponential Survival Vamos caber o modelo nulo, que é equivalente a um modelo de sobrevivência exponencial simples. Também armazenamos as estimativas para uso em testes posteriores. Observe o desvio astronômico. A estimativa da constante é o logaritmo da taxa de mortalidade geral. Vamos verificar este fato. Temos uma taxa de mortalidade geral de 18,4 óbitos por mil anos-criança de exposição. Três Exponentials On para os modelos de um fator. Começamos com o modelo de coorte, que é equivalente a um modelo de sobrevivência exponencial separado para cada coorte: Compare esses resultados com as estimativas de efeito bruto na Tabela 7.3. Note-se que a taxa de risco diminuiu 26 entre as coortes de 1941-59 e 1960-67, mas parece ter aumentado quase 8 para a coorte de 1968-76 em comparação com a coorte 1941-59. (Voltaremos a esta questão.) O desvio astronômico mostra que esse modelo não fornece uma descrição razoável dos dados. No entanto, é melhor do que o modelo em que todas as coortes seguem a mesma curva de sobrevivência exponencial, como evidenciado pelo modelo de qui-quadrado ou o teste de Wald. Ambos os testes são altamente significativos, indicando que as taxas de mortalidade geral não são as mesmas em todas as coortes. Surpreendência Exponencial Piece-Wise Agora, consideramos o modelo de idade, onde o perigo depende da idade da criança: o modelo de idade é equivalente a um modelo de sobrevivência exponencial por partes sem efeitos de coorte. Compare os resultados com os efeitos brutos na Tabela 7.3. Observe a diminuição dramática no risco com a idade. Na idade de 1, o risco de morte é apenas 5 do que é no primeiro mês de vida. Este modelo ainda não se ajusta aos dados, como evidenciado pelo desvio ou pela qualidade do chi quadrado. É, no entanto, uma melhoria notável em relação ao nulo, conforme indicado pelo modelo chi-quadrado ou o teste de Wald. Você pode ver por que os demógrafos preferem taxas de mortalidade específicas de idade. O Modelo de Riscos Proporcionais Agora no modelo aditivo com os principais efeitos da idade e da coorte, o que equivale a um modelo de riscos proporcionais: Observe que este modelo se encaixa razoavelmente bem, com um desvio de 6.18 em 12 d. f. De modo que a hipótese de riscos proporcionais é consistente com os dados. Compare os resultados com as estimativas de efeito líquido na Tabela 7.3 e note que a anomalia com a coorte mais jovem desapareceu. As estimativas agora indicam um declínio constante da mortalidade em todas as coortes. Tomando a coorte 1941-59 como uma linha de base, a mortalidade em todas as idades de zero para dez foi 28 menor para a coorte 1960-67 e 36 menores para a coorte mais recente de 1968-76. Você pode explicar por que essa tendência não surgiu enquanto não controlávamos a idéia de idade. A pesquisa foi conduzida em 1976. Heres um teste de razão de verossimilhança para o efeito de coorte ajustado para a idade. Observe que comparamos o modelo de idade (que salvamos) com o modelo aditivo que tem idade e coorte. Isso é seguido pelo teste de Wald. As diferenças de coorte entre grupos etários são altamente significativas. Estimando Probabilidades de Sobrevivência Vamos calcular a tabela de vida ajustada mostrada na Tabela 7.4 das notas da aula. O comando predizer após uma regressão de Poisson calcula o número esperado de eventos, então precisamos dividir por exposição para obter taxas ajustadas. Uma alternativa é usar as opções xb e nooffset (você precisa de ambos) para obter o preditor linear ou risco de log, que você pode então exponencializar para obter a taxa de risco adequada. Neste ponto, lembre-se de que os intervalos de idade têm diferentes larguras. Nós armazenamos as larguras em meses na largura variável. Agora vamos convertê-lo em anos, portanto, está nas mesmas unidades que a exposição. Agora classificaremos os dados por idade dentro de cada coorte e calcularemos o risco acumulado para cada coorte como uma soma corrente dos tempos de perigo da largura do intervalo. Usamos o fato de que S (t) exp para obter a função de sobrevivência. A última coisa a fazer é imprimir nosso trabalho útil. Eu usarei o comando tabulate em vez de listar para obter um layout bidirecional adequado. Eu especifico a média para listar o valor único em cada combinação de idade e coorte. Verificamos que a probabilidade de sobreviver até a idade 1 aumentou de 89,3 para 92,2 e, em seguida, para 93,2 em todas as coortes. O complemento da probabilidade de sobreviver até a idade um é conhecido como a taxa de mortalidade infantil (embora seja uma probabilidade, não uma taxa) e geralmente é expressa por mil nascimentos, diminuiu de 106,7 para 78,3 para 67,5 em todas as coortes. Outros métodos A Stata tem comandos para ajustar alguns dos modelos paramétricos discutidos nas notas bibliográficas, como o modelo Weibull. Ele também possui métodos não paramétricos, incluindo procedimentos para calcular as estimativas de Kaplan-Meier e para ajustar os modelos de regressão de Cox por probabilidade parcial. Finalmente, a Stata possui instalações para geração de arquivos de ano-pessoa. Siga o link abaixo para outro exemplo, aplicando um modelo de sobrevivência exponencial por partes, desta vez para a reincidência usando dados individuais e não agrupados e ilustrando a criação de arquivos de ano-pessoa. Copie 2017 Germaacuten Rodriacuteguez, Universidade de Princeton

No comments:

Post a Comment