¿Cómo mantener columnas específicas por nombre en R DataFrames?

Subconjunto R DataFrames por uno o varios nombres de columna

Para crear un subconjunto de R DataFrame y mantener algunas de sus columnas, use el siguiente código:

base R:

hr_subset <- subset(hr, select = c(language, interviews))

paquete dplyr:

library(dplyr) hr_subset <- select(hr, language, interviews)

Inicializar marco de datos

Para iniciar este tutorial, crearemos un R DataFrame de muestra.

language <- c ('Java', 'Python', 'Javascript', 'C#', 'R', 'Julia') month <- c ('September', 'September', 'October', 'December', 'October', 'September') interviews <- c (163, 229, 131, 191, 131, 153) hr <- data.frame (month = month, language = language, interviews = interviews)

Mantenga una o varias columnas con base R

Use la función de subconjunto (parte de R-Base) para mantener solo las columnas requeridas:

hr_subset <- subset(hr, select = c(language, interviews))

Esto devolverá el siguiente DataFrame:

entrevistas de idiomas
1 Java 163
2 Pitón 229
3 JavaScript 131
4 C# 191
5 R 131
6 julia 153

Subconjunto DataFrame por índice de columna

Para mantener indexadores de columnas específicos, puede usar el siguiente código R:

hr_subset <- hr[, c (2,3) ]

El resultado será el mismo subconjunto que creamos antes.

Filtrar marco de datos por columna con dplyr

Podemos usar dplyr, un paquete de manipulación de datos muy poderoso para R, para dividir nuestro marco de datos por nombre de columna:

library(dplyr) hr_subset <- select(hr, language, interviews)

Observación: deberá asegurarse de que dplyr esté disponible en su entorno RStudio antes de usarlo. Puede verificar si ese es el caso ejecutando el siguiente comando:

find.package("dplyr")

Aprendizaje relacionado

¿Cómo eliminar la última columna de un R DataFrame?