Laat dataframe kolommen op naam vallen

Question

Meer

Vraag

Laat dataframe kolommen op naam vallen

Ik heb een aantal kolommen die ik wil verwijderen uit een dataframe. Ik weet dat we ze individueel kunnen verwijderen met iets als:

df$x <- NULL

Maar ik hoopte dit met minder commando's te kunnen doen.

Ook weet ik dat ik kolommen kan laten vallen met behulp van integer indexering zoals deze:

df <- df[ -c(1, 3:6, 12) ]

Maar ik ben bezorgd dat de relatieve positie van mijn variabelen kan veranderen.

Gezien hoe krachtig R is, dacht ik dat er misschien een betere manier is dan elke kolom één voor één te laten vallen.

Henrik

Bewerkte vraag 29ste6 januari 2017 в 11:06

Programmering

r

dataframe

r-faq

Oplossing / Antwoord

Prasad Chalasani

5de2 januari 2011 в 2:52

Meer

Er is ook het subset commando, handig als je weet welke kolommen je wilt:

df <- data.frame(a = 1:10, b = 2:11, c = 3:12)
df <- subset(df, select = c(a, c))

UPDATED na commentaar van @hadley: Om de kolommen a,c te drop zou je kunnen doen:

df <- subset(df, select = -c(a, c))

Max Ghenis

Bewerkt antwoord 8ste6 april 2018 в 1:02

416

0

Joshua Ulrich

5de2 januari 2011 в 2:40

Meer

Je zou %in% als volgt kunnen gebruiken:

df[, !(colnames(df) %in% c("x","bar","foo"))]

105

0

Vraag toevoegen

Categorieën

Alle

Technologie

Cultuur / Recreatie

Leven / Kunst

Wetenschap

Professioneel

Business

Gebruikers

Alle

Nieuw

Populair

1

Ксения Комарова

Geregistreerd 2 weken geleden

2

Артур «Апер»

Geregistreerd 1 maand geleden

3

Viktor Malyutin

Geregistreerd 2 maanden geleden

4

Viktor Malyutin

Geregistreerd 2 maanden geleden

5

Syahputra Zhedenk

Geregistreerd 2 maanden geleden

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Joris Meys · Accepted Answer · 2011-01-05T14:40:25+00:00

U kunt een eenvoudige lijst met namen gebruiken :

DF <- data.frame(
  x=1:10,
  y=10:1,
  z=rep(5,10),
  a=11:20
)
drops <- c("x","z")
DF[ , !(names(DF) %in% drops)]

Of u kunt een lijst maken van degenen die u wilt behouden en ze bij naam noemen :

keeps <- c("y", "a")
DF[keeps]

EDIT : Voor degenen die nog steeds niet bekend zijn met het drop argument van de indexeringsfunctie, als je één kolom als een dataframe wilt houden, dan doe je dat:

keeps <- "y"
DF[ , keeps, drop = FALSE]

drop=TRUE (of het niet vermelden ervan) zal onnodige dimensies laten vallen, en dus een vector teruggeven met de waarden van kolom y.