Outliers

Intervalo De Confiança

Olá pessoal, tudo bem? Hoje irei conversar sobre um termo muito utilizado na estatística, mas que a interpretação/conceito costuma gerar dúvidas: o Intervalo de Confiança. Antes de falar especificamente sobre o intervalo de confiança, é necessário introduzir alguns conceitos: população, amostra, estimadores pontuais e intervalares, além da distribuição amostral. Caso Vamos supor que estamos interessados em estimar o peso médio dos habitantes da cidade de Curitiba. Uma forma de fazer isso, seria realizar um censo e mensurar o peso de todos os habitantes da cidade.

Coeficiente de correlação de Pearson

No post de hoje, iremos tratar sobre um dos coeficientes mais comum e amplamente utilizados: o coeficiente de correlação de Pearson. Basicamente, calcula-se o coeficiente de correlação de Pearson quando duas variáveis são ditas como numéricas (isto é, quando elas são intervalares) e têm-se o interesse de saber o quanto a variabilidade de uma variável está correlacionada com a variabilidade de outra variável. O coeficiente de correlação de Pearson (r) varia entre -1 e +1, cujos valores próximos de -1 e +1 indicam forte correlação linear e próximos de 0 indicam ausência de correlação linear.

Gráfico Boxplot

Olá pessoal, tudo bem? Hoje irei tratar de um gráfico bem comum na análise de dados: o gráfico boxplot, também conhecido como whiskers and tail (BUSSAB; MORETTIN, 2010). Quando se tem uma variável que seja numérica e busca-se resumir ela a partir de medidas descritivas, um dos gráficos mais comuns é o boxplot. Pois ele permite visualizar a distribuição de uma variável em termos da sua locação (mediana/quartis), dispersão (variabilidade), grau de assimetria, presença de valores extremos/discrepantes (outliers), entre outros.