ENTENDENDO%20AN%C3%81LISE%20DE%20DADOS1.pdf
ENTENDENDO%20AN%C3%81LISE%20DE%20DADOS.pdf
  1. Dados são pedaços de informação sobre indivíduos organizados em variáveis. Por indivíduo, entende-se uma unidade de observação. Uma observação ou unidade de observação refere-se a uma determinada pessoa ou um objeto em particular. Ou seja, qualquer unidade particular de observação dentro de sua amostra do estudo.
  2. Para a variável, precisamos de uma determinada característica da unidade de observação. Por exemplo, a nível de pessoa podemos coletar dados sobre altura, peso, sexo, raça etc. Se colhemos dados sobre uma amostra de carros, podemos mensurar variáveis, tais como cores, pneu, quilometragem, modelo e número de lugares etc. Se nossa amostra inclui cidades, podemos obter medidas de variáveis tais como tamanho da população, receita fiscal, consumo de energia, número de hospitais e assim por diante.
    dadosVariaveis.jpg
  3. Um conjunto de dados (dataset) é, literalmente, feito de observações individuais e variáveis. Os conjuntos de dados são normalmente exibidos em tabelas em que as linhas representam indivíduos ou unidades de observação, e colunas representam variáveis.
  4. Exemplo de um conjunto de dados que mostra registros de um diário de bordo de uma pesquisa. Neste exemplo, as unidades de observação são dados sobre voos e as variáveis ​​são componente, tipo de componente, tipo de dado, tamanho e descrição. Cada linha, em seguida, dá-nos todas as informações sobre uma observação particular. Neste caso, um dado sobre voo, e cada coluna tem informações sobre uma determinada característica de todos os dados sobre voos.
    telaDados.jpg
  5. As variáveis ​​também podem ser classificadas em um dos dois tipos, quantitativa ou categóricas. Variáveis ​​quantitativas assumem valores numéricos e representam algum tipo de medição. As variáveis ​​categóricas, por outro lado, tomam uma categoria ou valores rotulados e colocam a observação do indivíduo em um de diversos grupos. Neste exemplo, existem variáveis ​​de cada tipo. Tamanho é uma variável ​​quantitativa. Tipo de componente e tipo de dados são variáveis ​​categóricas. Podemos codificar os valores de uma variável categórica como números. Por exemplo, sexo com 1 para homem e 2 para mulher. Porém, lembre-se que estes valores são apenas códigos, não tendo nenhum significado aritmética. Ou seja, não faz sentido adicioná-los, subtrair-los, multiplicar ou dividir-los. Ou até mesmo comparar a magnitude destes valores.
  6. Finalmente, um identificador único é uma variável que se destina a definir distintamente cada uma das unidades de observação do seu conjunto de dados. Os exemplos podem incluir números de série para dados sobre um determinado produto, números do cpf para dados sobre uma pessoa individual. Ou talvez números aleatórios gerados para qualquer tipo de observação. Para nos ajudar a organizar os nossos dados, cada conjunto de dados deve ter uma variável que identifica exclusivamente as observações. Esta variável é particularmente útil se você precisar mesclar informações entre diferentes conjuntos de dados. No nosso exemplo, o componente é um número de identificador único.
  7. Dados podem ser bastante diferentes. Mas uma vez que você tem os dados, as abordagens para analisá-lo estatisticamente são muitas vezes bastante similares em diferentes disciplinas.
  8. O primeiro passo para sua pesquisa será escolher um conjunto de dados que oferece a oportunidade de conduzir a pesquisa sobre um tema de seu interesse.
  9. O segundo passo será escolher uma questão de pesquisa para responder.