1. Por enquanto, vimos representações gráficas considerando dados obtidos a partir de uma variável, seja categórica ou quantitativa, e descrevemos a distribuição dessa única variável usando apresentações visuais apropriadas, bem como medidas numéricas de centro e dispersão. Agora, vamos visualizar nossas associações de interesse, explorando a relação entre duas variáveis.
  2. A nossa questão básica de pesquisa é simplesmente se duas variáveis ​​estão ou não associadas uma com a outra. Por exemplo, há uma relação entre a chuva e o ph? Existe uma relação entre distância de corpos d'água e espécies de árvores? O tipo de solo interfere nas espécies de árvore? O horário de pesca tem relação com a espécie de peixe?
  3. Antes de testar a nossa própria associação de interesse usando estatística inferencial, vamos trabalhar visualmente e descrever essa relação. É importante compreender que quando se estuda duas variáveis, cada variável tem um papel a desempenhar. Isto é, uma variável pode ser tanto uma variável de resposta, também conhecida como variável dependente, ou uma variável explanatória, também conhecida como variável independente ou preditora.
  4. Neste ponto, vamos impor um modelo causal em sua questão de pesquisa. Para fazer isso, você vai precisar designar qual de suas variáveis ​​é explanatória e qual variável é de resposta. Note que só podemos impor um modelo causal, ao invés de realmente testar a causalidade, porque estamos trabalhando com o que é chamado de dados observacionais. Em outras palavras, as bases de dados que estamos usando são baseadas em amostras que foram simplesmente observadas, ao invés de terem sido manipuladas ou influenciadas na forma como seria em numa experiência. Mesmo não sendo capaz de ter certeza que a associação que estamos testando é causal, pelo propósito de explorar a nossa pergunta, continua sendo importante determinar o papel que cada variável vai jogar no nosso modelo.
  5. Esta classificação tipo-função pode ser resumida e facilmente visualizada na tabela abaixo. Este sistema de classificação serve como uma estrutura para o resto do curso. Você vai descobrir que esta classificação não só vai ajudá-lo a construir gráficos, mas também é a base para selecionar ferramentas estatísticas que podem ser utilizadas para explorar a relação entre variáveis de seu interesse.
    explrespon.jpg
  6. As ferramentas para análise estatística e para representar visualmente a relação entre variáveis ​​baseia-se na função e no tipo de cada variável, se é resposta ou explicação, e se categórica ou quantitativa.
  7. Se queremos explorar, por exemplo, se o tipo de geomorfologia afeta espécies de árvore, vamos designar a geomorfologia como variável explicativa e a espécie de árvore como variável de resposta. Se quisermos explorar se a espécie de peixe pode ser explicado pelo ph da água, o ph seria a variável explicativa e a espécie de peixe seria a variável resposta. Se estamos analisando se um estudante de cursinho é um bom indicador para passar no vestibular na primeira tentativa, o cursinho seria a variável explicativa e a variável resultante seria o estudante passar no vestibular na sua primeira tentativa. Se queremos ver se o resultado de uma pessoa passar / falhar em um teste de condução de veículo pode ser explicado pelo período de tempo que essa pessoa pratica a condução, antes do teste, o tempo seria a variável explicativa e o teste de condução a variável de resposta.
  8. Um exemplo de questão de pesquisa, podemos decidir que a distância de corpos d'água será a variável explicativa, ou independente, para a altura da espécie de árvore, variável de resposta ou dependente. Mais especificamente, nós estamos interessados em saber se a altura de espécies de árvores são dependentes da distância de corpos d'água.
  9. Como é que vamos examinar a associação entre duas variáveis ​​graficamente? Na representação gráfica da associação entre duas variáveis, a variável independente ou explicativa, é traçada no eixo X. A variável dependente de resposta é representada no eixo Y. Esta é a convenção mais importante para ser usada quando se faz relações de variáveis graficamente. Porém, antes de construir nosso gráfico, há algumas questões que precisam ser levantadas sobre os tipos das variáveis ​​explicativas e de resposta.