Subconjunto R DataFrames por uno o varios nombres de columna
Para crear un subconjunto de R DataFrame y mantener algunas de sus columnas, use el siguiente código:
base R:
hr_subset <- subset(hr, select = c(language, interviews))
paquete dplyr:
library(dplyr) hr_subset <- select(hr, language, interviews)
Inicializar marco de datos
Para iniciar este tutorial, crearemos un R DataFrame de muestra.
language <- c ('Java', 'Python', 'Javascript', 'C#', 'R', 'Julia') month <- c ('September', 'September', 'October', 'December', 'October', 'September') interviews <- c (163, 229, 131, 191, 131, 153) hr <- data.frame (month = month, language = language, interviews = interviews)
Mantenga una o varias columnas con base R
Use la función de subconjunto (parte de R-Base) para mantener solo las columnas requeridas:
hr_subset <- subset(hr, select = c(language, interviews))
Esto devolverá el siguiente DataFrame:
entrevistas de idiomas1 | Java | 163 |
2 | Pitón | 229 |
3 | JavaScript | 131 |
4 | C# | 191 |
5 | R | 131 |
6 | julia | 153 |
Subconjunto DataFrame por índice de columna
Para mantener indexadores de columnas específicos, puede usar el siguiente código R:
hr_subset <- hr[, c (2,3) ]
El resultado será el mismo subconjunto que creamos antes.
Filtrar marco de datos por columna con dplyr
Podemos usar dplyr, un paquete de manipulación de datos muy poderoso para R, para dividir nuestro marco de datos por nombre de columna:
library(dplyr) hr_subset <- select(hr, language, interviews)
Observación: deberá asegurarse de que dplyr esté disponible en su entorno RStudio antes de usarlo. Puede verificar si ese es el caso ejecutando el siguiente comando:
find.package("dplyr")
Aprendizaje relacionado
¿Cómo eliminar la última columna de un R DataFrame?