Monday, 27 November 2017

Define Date Variable In Stata Forex


Para perguntas rápidas, envie um email para dataprinceton. edu. Nenhum appts. Necessário durante horas walk-in. Nota: o laboratório do DSS está aberto desde que o Firestone esteja aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Dados, conjuntos de dados e variáveis ​​Gerenciamento de dados Configuração de diretório de trabalho, arquivo de log, abertura / salvamento de um arquivo de dados Stata, sistema de codificação de cores Stata, renomeação, recodificação e criação de novas variáveis, droping casos, exclusão de variáveis, mesclar, anexar, freqüências, crosstabulations e estatística descritiva Clique aqui Arquivos de dados Um conjunto de dados é apenas um arquivo no qual as linhas representam observações e as colunas representam variáveis. Por exemplo, uma observação poderia ser um carro, e as variáveis ​​seriam peças de informação sobre o carro, como a marca, comprimento, preço e relação de transmissão: Se os dados já estão no formato de arquivo proprietário Statas, ele terá a Extensão dta. Por exemplo mydata. dta. Os dados nesse formato podem ser lidos diretamente no Stata com o comando use. Se Stata lhe der a mensagem de erro quando você tenta abrir um arquivo de dados, veja aqui para obter informações sobre como corrigir o problema. Stata pode ler conjuntos de dados em vários formatos de texto, bem como no formato proprietário Statas. Muitas vezes você vai começar com dados em formato de texto, lê-lo em Stata, e salvá-lo no formato Stata. Você também pode encontrar dados em vários outros formatos. Por exemplo, os dados de certos arquivos de dados são frequentemente formatados para o pacote estatístico SPSS. Um programa chamado DBMS / Copy. Disponível no laboratório DSS, bem como em máquinas Windows nos clusters públicos OIT, pode converter dados do SPSS e de muitos outros formatos para o formato Stata de forma rápida e fácil. Um formato de texto comum é o arquivo delimitado. Os arquivos delimitados são mais comumente separados por tabulação ou por vírgula. Isso significa apenas que as variáveis ​​em cada observação são inseridas uma após a outra em uma linha e separadas por guias ou vírgulas, enquanto as observações são separadas por retornos rígidos. O exemplo acima é realmente como um arquivo de texto delimitado por vírgulas seria procurar se aberto no Word. A sintaxe de comando para ler em um arquivo delimitado por tabulação ou por vírgulas é: onde filename é o nome do arquivo que contém os dados delimitados por tabulação ou por vírgula. É frequentemente usado para ler planilhas salvas como arquivos csv (delimitados por vírgulas) de um pacote como o Excel. Observe que uma planilha precisa ser colocada em um formulário Stata-friendly antes Stata será capaz de lê-lo adequadamente. Não fazer isso pode causar dores de cabeça. Para obter mais detalhes, consulte Há dois comandos além de insheet - infile e infix - que lêem outros tipos menos comuns de arquivos de texto. Se você tiver dados delimitados por espaço, dados de largura fixa ou encontrar um dicionário de dados Stata. Consulte Você pode usar o comando Stata save para salvar um arquivo no formato Stata: onde filename é o nome do seu arquivo Stata. Por exemplo: irá salvar um arquivo Stata chamado myfile. dta. Este arquivo pode ser lido no Stata com o comando use. Observe que a extensão de arquivo. dta é anexada automaticamente aos arquivos Stata. Você não precisa incluir a extensão de arquivo nos comandos use ou save. Se você já tem um arquivo Stata chamado myfile. dta e deseja salvar uma versão atualizada do arquivo com o mesmo nome, use o comando Stata save com a opção replace, como em: onde filename é o nome do arquivo que você deseja Para substituir, por exemplo Para salvar uma versão atualizada do arquivo ativo, você pode simplesmente digitar: Este comando irá destruir a versão anterior do seu arquivo, então use a opção replace somente se tiver certeza de que não precisará da versão mais antiga do seu arquivo. Não há nenhuma maneira de recuperar seu arquivo original, uma vez que outro arquivo tenha escrito sobre ele. Valores ausentes Às vezes, uma variável está faltando para algumas observações. (Faltando significa que não há valor - a pessoa não respondeu à pergunta da pesquisa, ou os dados não puderam ser adquiridos por algum outro motivo.) No Stata, valores ausentes em variáveis ​​numéricas são representados por um ponto (.). As observações com valores faltantes são deixadas de fora das tabelas produzidas por aba, e também são deixadas de fora das regressões. Eles aparecem como períodos no navegador de dados stata e são representados por pontos em comandos. Os valores de cadeia em falta aparecem como células em branco no browser e são representados nos comandos por duas aspas duplas sem nada entre elas (). O que entendemos por representado em comandos fará mais sentido um pouco mais tarde. Lembre-se que se você estiver salvando dados fora do Excel, os valores ausentes precisam ter sido deixados em branco para Stata para reconhecê-los como ausentes. Tipos de Variáveis ​​Stata Existem dois tipos de variáveis ​​no Stata: numeric e string. Um terceiro tipo, data, é realmente um tipo especial de numérico, como veremos. As variáveis ​​numéricas são simples - contêm números. As variáveis ​​de cadeia contêm texto que pode conter quaisquer caracteres no teclado: letras, números e caracteres especiais. Em auto3, make é uma variável de string - todos os outros são numéricos. Podemos fazer cálculos numéricos e análise estatística em variáveis ​​numéricas - não podemos em variáveis ​​de cadeia. As variáveis ​​de cadeia são geralmente usadas como identificadores para a observação. Uma das variáveis ​​numéricas, date, destina-se a representar uma data - digamos que foi a data em que os dados sobre cada carro foram coletados. Em Stata, as datas são números que representam o número de dias desde 1º de janeiro de 1960. Representar datas como números dessa forma nos permite fazer cálculos sobre eles, como medir o tempo entre duas datas. Mas parece estranho e Stata tem uma maneira simples de fazer as variáveis ​​de data parecerem datas: (O comando format tem outros usos, que você pode ver digitando o formato da ajuda.) Você pode usar o comando di juntamente com a função d () Para exibir o valor Stata de qualquer data: Para obter mais informações sobre como Stata processa datas e dados de tempo, consulte Dados de séries de tempo em Stata Variável Convenções de nomenclatura As regras para nomear variáveis ​​em Stata são simples: Stata é sensível a maiúsculas e minúsculas, Letras maiúsculas e minúsculas em nomes de variáveis ​​é uma boa idéia. Eles podem conter no máximo 32 caracteres. Eles podem conter letras, números ou sublinhados (). Espaços ou outros caracteres especiais (como ,,, etc.) não são permitidos. O primeiro caractere deve ser uma letra ou sublinhado, não um número. Iniciar nomes de variáveis ​​com sublinhados é uma idéia muito ruim, uma vez que Statas built-in variáveis ​​começam com um sublinhado. Renomeando Variáveis ​​Alterar um nome de variáveis ​​no Stata é fácil com o comando rename: copy 2007 The Trustees of Princeton University. Todos os direitos reservados. Dataprinceton. edu NOTA: A informação é para a Universidade de Princeton. Sinta-se livre para usar a documentação, mas não podemos responder a perguntas fora de Princeton Esta página foi atualizada em: Para perguntas rápidas, envie um e-mail para dataprinceton. edu. Nenhum appts. Necessário durante horas walk-in. Nota: o laboratório do DSS está aberto desde que o Firestone esteja aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Dados de séries temporais em Stata Dados de séries temporais e tsset Para usar as funções e análises de séries temporais Statas, você deve primeiro se certificar de que seus dados são, de fato, séries temporais. Primeiro, você deve ter uma variável de data que está no formato de data Stata. Em segundo lugar, você deve certificar-se de que seus dados são classificados por esta variável de data. Se você tiver dados de painel, seus dados devem ser classificados pela variável de data dentro da variável que identifica o painel. Finalmente, você deve usar o comando tsset para informar ao Stata que seus dados são séries temporais: O primeiro exemplo diz a Stata que você tem dados simples de séries temporais eo segundo informa a Stata que você tem dados de painel. Stata Data Format Stata armazena as datas como o número de dias decorridos desde 1 de janeiro de 1960. Existem diferentes maneiras de criar datas de Stata decorridas que dependem de como as datas são representadas em seus dados. Se seu conjunto de dados original já contém uma única variável de data, use a função date () ou um dos outros comandos de string-date. Se você tiver variáveis ​​separadas armazenando diferentes partes da data (mês, dia e ano, ano e trimestre, etc.), então você precisará usar as funções de datas parciais. Funções de data para uma única variável de data de string Às vezes, seus dados terão as datas no formato de seqüência de caracteres. (Uma variável de cadeia é simplesmente uma variável que contém algo diferente de apenas números.) Stata fornece uma maneira de convertê-los para datas de séries temporais. A primeira coisa que você precisa saber é que a seqüência deve ser facilmente separada em seus componentes. Em outras palavras, seqüências de caracteres como 01feb1990 01 de fevereiro de 1990 02/01/90 são aceitáveis, mas 020190 não é. Por exemplo, vamos dizer que você tem uma variável de seqüência de caracteres sdate com valores como 01feb1990 e você precisa convertê-lo para uma data-série diária data: Note que nesta função, como com as outras funções para converter seqüências de caracteres para datas-série, A porção DMY indica a ordem do dia, mês e ano na variável. Se os valores tivessem sido codificados como 1 de fevereiro de 1990, teríamos usado MDY em vez disso. E se a data original só tiver dois dígitos para o ano Então usaríamos: Sempre que você tem dois anos dígito, basta colocar o século antes da Y. Se você tem os últimos dois anos dígito misturado, como 1/2/98 e 1/2/00, use: onde 2020 é o maior ano que você tem em seu conjunto de dados. Aqui estão as outras funções: semanal (stringvar, wy) mensal (stringvar, my) trimestral (stringvar, qy) halfyearly (stringvar, hy) anuais (stringvar, y) Nota: Stata 10 usa letras maiúsculas como DMY enquanto a versão anterior de Stata usa minúsculas, dmy. Funções de data para variáveis ​​de data parciais Muitas vezes você terá variáveis ​​separadas para os vários componentes da data em que você precisa colocá-los juntos antes de poder designá-los como datas apropriadas de séries temporais. Stata fornece uma maneira fácil de fazer isso com variáveis ​​numéricas. Se você tiver variáveis ​​separadas para mês, dia e ano, use a função mdy () para criar uma variável de data decorrida. Depois de criar uma variável de data decorrida, você provavelmente vai querer formatá-la, conforme descrito abaixo. Use a função mdy () para criar uma variável de data Stata decorrida quando os dados originais contiverem variáveis ​​separadas para mês, dia e ano. As variáveis ​​mês, dia e ano devem ser numéricas. Por exemplo, suponha que você esteja trabalhando com esses dados: Convertendo uma variável de data armazenada como um único número Se você tiver uma variável de data onde a data é armazenada como um único número do formulário yyyymmdd (por exemplo, 20041231 para 31 de dezembro de 2004) O seguinte conjunto de funções irá convertê-lo em uma data Stata decorrido. Gen ano int (data / 10000) gen mês int ((data-ano10000) / 100) gen dia int ((data-ano10000-mês100)) gen mydate mdy (mês, dia, ano) O comando format para exibir as datas de Stata decorridas como datas de calendário. No exemplo acima, a variável de data decorrida, mydate, tem os seguintes valores, que representam o número de dias antes ou depois de 1º de janeiro de 1960. Para obter mais informações, consulte o Stata Users Guide, capítulo 27. Especificando datas Muitas vezes precisamos Consuct uma análise particular somente em observações que caem em uma certa data. Para fazer isso, temos que usar algo chamado data literal. Um literal de data é simplesmente uma maneira de inserir uma data em palavras e ter Stata automaticamente convertê-lo para uma data decorrida. Como com o literal d () para especificar uma data regular, existem os literais w (), m (), q (), h () e y () para digitar semanalmente, mensalmente, trimestral, semestral e Anualmente, respectivamente. Aqui estão alguns exemplos: Se você quiser especificar um intervalo de datas, você pode usar as funções tin () e twithin (): A diferença entre tin () e twithin () é que tin () inclui as datas de início e de término, Enquanto que twithin () as exclui. Introduza sempre a data de início em primeiro lugar e escreva-as como faria para qualquer uma das funções d (), w (), etc. Listas de variáveis ​​de séries temporais Muitas vezes, em análises de séries temporais, precisamos atrasar ou guiar os valores de uma variável de uma observação para a seguinte. Se tivermos muitas variáveis, isso pode ser complicado, especialmente se precisarmos atrasar uma variável mais de uma vez. No Stata, podemos especificar quais variáveis ​​devem ser defasadas e quantas vezes sem ter que criar novas variáveis, economizando assim um monte de espaço em disco e memória. Você deve observar que o comando tsset deve ter sido emitido antes que qualquer um dos truques nesta seção funcione. Além disso, se você definiu seus dados como dados do painel, o Stata reiniciará automaticamente os cálculos quando chegar ao início de um painel, portanto você não precisa se preocupar com os valores de um painel sendo transferido para o próximo. L. varname e F. varname Se você precisa atrasar ou conduzir uma variável para uma análise, você pode fazer isso usando o nome L. varname (a lag) e F. varname (para levar). Ambos funcionam da mesma maneira, tão bem apenas mostre alguns exemplos com L. varname. Vamos dizer que você quer regredir esta renda anos sobre a renda dos últimos anos: iria realizar isso. O L. diz Stata a renda lag por um período de tempo. Se você quis atrasar a renda por mais de um período de tempo, você mudaria simplesmente o L. a algo como L2. Ou L3. Para retardá-lo em 2 e 3 períodos de tempo, respectivamente. Os dois comandos a seguir produzirão os mesmos resultados: D. varname Outro atalho útil é D. varname, que leva a diferença de renda no tempo 1 e renda no tempo 2. Por exemplo, digamos que uma pessoa ganhou 20 ontem e 30 hoje. Stata: Análise de dados e software estatístico Alan Riley, StataCorp Você pode gravar datas de qualquer maneira que você quiser, mas há apenas uma técnica que Stata entende, chamado de data decorrida. Uma data decorrida é o número de dias a partir de 1 de Janeiro de 1960. Neste formato, Stata fornece funções para converter datas em datas decorridas, formatos para imprimir datas decorridas em formas compreensíveis e outras funções para manipular datas decorridas. Conversão em datas decorridas São fornecidas duas funções: mdy () e date (). Mdy () leva três argumentos numéricos mdash mês, dia, ano mdash e retorna a data decorrida correspondente. Para os seguintes dados, gen edate mdy (mês, dia, ano) produzirá os seguintes dados: date (). Por outro lado, leva dois argumentos string: o primeiro é a data a ser convertida eo segundo informa a data () da ordem do mês, dia e ano. Date () retorna a data decorrida correspondente. Para os dados a seguir, criará duas variáveis, edate1 e edate2. Que contenham as mesmas informações. Exibição de datas Uma vez convertido para o formato de data decorrido, você pode atribuir formato Statas d à variável para que as datas sejam legíveis. Várias variações são possíveis para exibir datas. Para os seguintes dados, mudará o formato de exibição para formatar edate dMd, CY mudará o formato de exibição para vários outros formatos são possíveis. Para obter ajuda on-line, digite as datas de ajuda no Stata ou consulte U 30 Comandos para lidar com datas.

No comments:

Post a Comment