--- title: "Ecologia Numérica" subtitle: "Exame Prático" author: "Nome do(s) alunos e número(s) do(s) aluno(s)" date: "7 de Fevereiro de 2020" output: html_document: default pdf_document: default --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` # Instruções **Antes de começar o exemplo, leia estas instuções com MUITA atenção** # Comece por compilar este .Rmd no seu computador, para verificar que funciona e que não desformatou. Se desformatou, fazer "File|Reopen with encoding..." e escolher UTF-8! Nota: se um pedaço de código (*code chunk*) não estiver a correr, poderá forçar a compilação do documento, permitindo assim continuar o seu exame, usando o seguinte cabeçalho no respectivo chunk: `{r eval=FALSE}`. Desta forma, o código fica no documento mesmo que não esteja a correr correctamente e poderá assim ter a sua resposta (parcialmente) correcta. Este é um exame realizado exclusivamente em R. Todo o código utilizado deverá estar visível no HTML resultante da compilação do .Rmd que é entregue. Justifique adequadamente todas as suas respostas, não se limitando a apresentar output de código. # Para evitar problemas, recomenda-se vivamente que não corra *chuncks* individuais mas que cada vez que queira ver o output compile o .Rmd completo. Há situações em que correr *chunck* a *chunck* origina resultados diferentes de compilar todo o documento. Crie uma pasta onde deverá colocar todos os ficheiros e objetos criados durante o exame, incluindo os ficheiros de dados que sejam utilizados no decorrer do mesmo. Com base neste .Rmd, crie um relatório dinâmico em RMarkdown, com um título apropriado, a identificação dos autores (nome e respetivo número), **onde deverá apresentar todo o código necessário e output para a realização do exame**. Perguntas respondidas sem o código necessário para compreender a resposta poderão ser consideradas erradas. O nome do ficheiro deverá ser: * EPENE2A1920A*****.Rmd (para exame individual) * EPENE2A1920A*****A*****.Rmd (/para exame a pares) onde ***** representa(m) o(s) número(s) de aluno correspondente(s). Deverá entregar, **SEM FALTA**, os seguintes ficheiros via e-mail: 1. o Rmd (este documento, depois de editado com as suas respostas); 2. o HTML correspondente 3. todos os ficheiros de dados utilizados Os ficheiros deverão ser enviado para dois e-mails: 1. Tiago Marques em tamarques@fc.ul.pt 2. Susana França em sofranca@fc.ul.pt O nome dos alunos e os seus números de aluno deverão ser apresentados também no corpo do e-mail. O assunto deverá ser "EN-exame P-A*****" no caso de um aluno ou "EN-exame P-A*****A*****" no caso de um par, onde o ***** é substituido pelos correpondentes números de aluno. Apenas deverá abandonar a sala depois de confirmar que o seu exame foi recebido por um dos professores. Se precisar de utilizar algum package opcional poderá carregá-lo no proximo chunck. Para sua comodiade, o package `vegan` (para implementar análises multivariadas) já está carregado por default. ```{r,echo=FALSE,message=FALSE,warning=FALSE} #DO NOT DELETE THIS OR THE EXAM .Rmd MIGHT NOT COMPILE!!! library(vegan) #DO NOT DELETE THIS OR THE EXAM .Rmd MIGHT NOT COMPILE!!! ``` # Exercício 1 Importe o conjunto de dados "LuaMil50915.xlsx", descrito em "LuaMil50915MD.txt" usando as regras que foram apresentadas aos alunos no inicio do ano para a recolha de um conjunto de dados. (dica: se não souber como importar um .xlsx, a função `read_excel` do package `readxl` poderá ser muito útil!) ## Exercicio 1.1 (1) Quantas árvores foram amostradas? Quantas folhas foram medidas para cada árvore? Qual o comprimento da folha mais comprida? *Apague este texto e escreva a sua resposta aqui.* ## Exercicio 1.2 (1) Represente graficamente a relação entre a largura da folha e o diametro à altura do peito. Descreva a relação encontrada. *Apague este texto e escreva a sua resposta aqui.* ## Exercicio 1.3 (1.25) Calcule a correlação entre a largura da folha e o comprimento da folha. Teste se a correlação é estatisticamente significativa. *Apague este texto e escreva a sua resposta aqui.* ## Exercício 1.4 (1.5) Compare se há uma diferença entre o comprimento da primeira folha (`comp1`) e segunda folha (`comp2`) das árvores *Apague este texto e escreva a sua resposta aqui.* # Exercício 2 Considere o conjunto de dados `CO2` do package `datasets`. ## Exercício 2.1 (1.75) Descreva e interprete os dados recorrendo a multiplas representações gráficas. *Apague este texto e escreva a sua resposta aqui.* ## Exercício 2.2 (1.25) A variável que mede a concentração é de que tipo, continua ou discreta? Como acha que faz mais sentido utiliza-la para explicar o uptake, como um número ou como um factor? *Apague este texto e escreva a sua resposta aqui.* ## Exercício 2.3 (1.25) Quais as variáveis explicativas que melhor explicam o uptake? (ignore a variável `Plant`) *Apague este texto e escreva a sua resposta aqui.* ## Exercício 2.4 (1.75) Compare os resultados obtidos na alinea anterior com os obtidos com outra familia. Qual o melhor modelo? *Apague este texto e escreva a sua resposta aqui.* ## Exercício 2.5 (1.75) A comparação dos dois modelos usando dois criterios diferentes (e.g. graficos de residuos vs AIC) é consistente? Caso não seja, que modelo escolheria? É importante a escolha, neste caso? *Apague este texto e escreva a sua resposta aqui.* # Exercício 3 O código seguinte carrega um conjunto de dados do package `vegan`, denominado `mite`. É um conjunto de dados multivariados que representa a abundancia de 35 espécies de ácaros. O conjunto de dados é composto por 4 subconjuntos. Explore estes dados. ```{r} library(vegan) data(mite) data(mite.env) data(mite.pcnm) data(mite.xy) ``` ## Exercício 3.1 (1.25) Quantas espécies tem mais de 100 individuos. Qual o local com mais individuos? E qual o local com menos? *Apague este texto e escreva a sua resposta aqui.* ## Exercício 3.2 (1.25) Implemente uma análise de ordenação directa para explicar como se organizam as comunidades de ácaros em função das variáveis ambientais. Quais as variáveis ambientais mais fortemente associadas com o primeiro eixo. Porquê? *Apague este texto e escreva a sua resposta aqui.* ## Exercício 3.3 (1.75) As coordenadas dos locais estão no objecto `mite.xy`. Explore graficamente a relação entre a localização no espaço e a quantidade total de ácaros. (dica: crie um indicador que contenha a informação se o número total de ácaros é maior ou menor que a média do número total de ácaros por local, e faça a cor do texto a plotar num gráfico com as coordenadas dos pontos diferente para pontos abaixo ou acima da média) *Apague este texto e escreva a sua resposta aqui.* ## Exercicio 3.4 (1.25) Realize uma análise de agrupamento com base nos dados das contagens dos ácaros. Algum ponto sobresai na análise? Qual? O que tem os dados desse ponto de especial? *Apague este texto e escreva a sua resposta aqui.* ## Exercicio 3.5 (2) Realize uma PCA adequada para representar os locais em função dos ácaros. Refira qual a quantidade de variação retida nos 2 primeiros eixos. Quantos eixos reteria para interpretar a análise (não é necessário fazer a interpretação)? (o ficheiro adicional "brocardfunctions.R" pode ser util aqui!) *Apague este texto e escreva a sua resposta aqui.*