primera clase.pptx [S lo lectura]) - GEDIC · 2020. 11. 9. · Exportación de datos - Los datos...
Transcript of primera clase.pptx [S lo lectura]) - GEDIC · 2020. 11. 9. · Exportación de datos - Los datos...
-
09/11/2020
1
Curso R
Primera clase
Javier Mariani
Sobre el curso:
- Encuentros presenciales cada 2 semanas de 120’.
- Introducción teórica de aprox 40’ (repaso de conceptos y corrección de
ejercicios pendientes).
- Trabajo con la computadora el resto del tiempo.
- Último encuentro, actividad integradora y consultas.
- Todo lo que haremos está disponible en campus por lo que no es necesario
tomar apuntes.
Estadísticas con R Javier Mariani
Requerimientos
- Instalar R.
- Instalar RStudio.
- Los encuentros utilizarán paquetes específicos que serán enviados antes de
cada clase.
Estadísticas con R Javier Mariani
-
09/11/2020
2
Introducción
- R es un conjunto integrado de programas para la manipulación de datos, el
cálculo y la visualización gráfica.
Estadísticas con R Javier Mariani
- Es una implementación del lenguaje S (utilizado por el programa S-Plus).
- Es gratuito y abierto.
- Tiene más de 2.000 paquetes para resolver las más diversas situaciones.
- Sin embargo, puede ser frustrante al comienzo.
Estadísticas con R Javier Mariani
-
09/11/2020
3
Introducción
- Tiene la posibilidad de realizar desde cálculos sencillos hasta integrar datos
en tiempo real por vía web (gráficos interactivos, mapas, traducción).
Estadísticas con R Javier Mariani
- A diferencia de otros paquetes estadísticos, R es orientado a objetos
- Los resultados que muestra son menos que otros paquetes.
- Todo se puede almacenar para utilizarlo.
Estadísticas con R Javier Mariani
Estadísticas con R Javier Mariani
-
09/11/2020
4
Estadísticas con R Javier Mariani
Introducción
- Tiene la posibilidad de realizar desde cálculos sencillos hasta integrar datos
en tiempo real por vía web (gráficos interactivos, mapas, traducción).
Estadísticas con R Javier Mariani
- A diferencia de otros paquetes estadísticos, R es orientado a objetos
- Los resultados que muestra son menos que otros paquetes.
- Todo se puede almacenar para utilizarlo.
- RStudio es un programa que permite una interface más dinámica y ofrece
funcionalidades adicionales.
Estadísticas con R Javier Mariani
-
09/11/2020
5
Introducción
- Tras la instalación inicial seleccionar el lugar donde R guardará el trabajo
(todo se guarda allí, e incluso los gráficos).
Estadísticas con R Javier Mariani
Estadísticas con R Javier Mariani
Ayuda
- Junto con la instalación, hay una gran cantidad de información útil (muchas
de las búsquedas en la web, derivan a documento disponibles): help.start()
Estadísticas con R Javier Mariani
-
09/11/2020
6
Estadísticas con R Javier Mariani
Ayuda
- Junto con la instalación, hay una gran cantidad de información útil (muchas
de las búsquedas en la web, derivan a documento disponibles): help.start()
Estadísticas con R Javier Mariani
- Desde R: RSiteSearch("logistic regression"). Va al término en la página
de R (www.r-project.org)
- En la Web hay muchas páginas muy útiles (Stack Overflow es muy buena).
Estadísticas con R Javier Mariani
-
09/11/2020
7
Ayuda
- Junto con la instalación, hay una gran cantidad de información útil (muchas
de las búsquedas en la web, derivan a documento disponibles): help.start()
Estadísticas con R Javier Mariani
- Desde R: RSiteSearch("logistic regression"). Va al término en la página
de R (www.r-project.org)
- En la Web hay muchas páginas muy útiles (Stack Overflow es muy buena).
- Los paquetes tienen los mails de los autores y responden dudas y corrigen errores
(bugs) de los paquetes.
Estadísticas con R Javier Mariani
Instalación de paquetes
- Los paquetes necesarios se pueden instalar desde diferentes vías:
Estadísticas con R Javier Mariani
- Desde la consola: install.packages(“”)
-
09/11/2020
8
Estadísticas con R Javier Mariani
Instalación de paquetes
- Los paquetes necesarios se pueden instalar desde diferentes vías:
Estadísticas con R Javier Mariani
- Desde la consola: install.packages(“”, dependencies=TRUE)
- Desde la ventana interactiva ”Install” de RStudio.
Estadísticas con R Javier Mariani
-
09/11/2020
9
Instalación de paquetes
- Los paquetes necesarios se pueden instalar desde diferentes vías:
Estadísticas con R Javier Mariani
- Desde la consola: install.packages(“”, dependencies=TRUE)
- Desde la ventana interactiva ”Install” de RStudio.
- Desde Github.com
- Este es un repositorio, y requiere el paquete ”devtools”
- Usualmente, las versiones más nuevas están antes de estar en el
Comprehensive R Archive Network (CRAN)
Estadísticas con R Javier Mariani
Tipos de objetos
- R puede almacenar una gran cantidad de objetos diferentes, los básicos:
Estadísticas con R Javier Mariani
- Vectores: conjunto de valores del mismo tipo.
- Matrices: conjuntos de vectores del mismo tipo.
- Cuadros de datos (dataframe): conjuntos de vectores de distintos
tipos.
- Listas: conjuntos de objetos de distintos tipos.
-
09/11/2020
10
Tipos de Variables
- Las variables son similares a otros paquetes estadísticos:
Estadísticas con R Javier Mariani
- Numéricos: números continuos.
- Enteros (integer): números enteros.
- Factores: variables categóricas. Se utilizan en análisis que requieren
categorías (por ejemplo, ANOVA o lm) y para agrupar.
- Carácter: variables de texto.
- Fechas.
- Lógicas: usualmente resultantes de operaciones lógicas.
Importación de datos
- R importa (y exporta numerosos formatos de bases de datos):
Estadísticas con R Javier Mariani
- En RStudio, en el cuadrante superior derecho en “Environment”,
hacer click en “Import dataset”.
Estadísticas con R Javier Mariani
-
09/11/2020
11
Importación de datos
- R importa (y exporta numerosos formatos de bases de datos):
Estadísticas con R Javier Mariani
- En RStudio, en el cuadrante superior derecho en “Environment”,
hacer click en “Import dataset”.
- El paquete “foreign” permite importar aún más formatos de datos.
- R no importa datos desde MS Access.
- Revisar los nombres de las variables y la base ANTES de importar.
Estadísticas con R Javier Mariani
Exportación de datos
- Los datos que se importan se copian en formato R en el espacio de trabajo,
para guardar una versión de las bases en otros formatos, se deben exportar:
Estadísticas con R Javier Mariani
- R trae una función genérica para exportar en formato texto (csv).
- write.csv(nombre de la base, “lugar y nombre del achivo”)
- El paquete “xlsx” tiene funciones para exportar en .xlsx
-
09/11/2020
12
Estadísticas con R Javier Mariani
Manipulación de variables
- Existen numerosas funciones para trabajar con variables y recodificarlas:
Estadísticas con R Javier Mariani
- Para utilizar una variable se puede ”unir” la variable al directorio de
trabajo.
- Escribir la ubicación de la variable en el espacio de trabajo
mibasededatos$variable
Estadísticas con R Javier Mariani
-
09/11/2020
13
Estadísticas con R Javier Mariani
Manipulación de variables
- Las conversiones de formatos, por ejemplo de números a factores, pueden
ser necesarios en algunos análisis y gráficos.
Estadísticas con R Javier Mariani
Estadísticas con R Javier Mariani
-
09/11/2020
14
Estadísticas con R Javier Mariani
Manipulación de variables
- Las conversiones de formatos, por ejemplo de números a factores, pueden
ser necesarios en algunos análisis y gráficos.
Estadísticas con R Javier Mariani
- Se pueden realizar cálculos entre variables, conversiones lógicas,
búsquedas de texto, etc.
- Otro tipo de transformaciones como operaciones con un escalar o
transformaciones logarítmicas, raíces, exponentes, son igualmente
factibles y frecuentes.