Tag: dplyr

Установка нескольких регрессионных моделей с dplyr

Я хотел бы подгонять модель для каждого часа (фактор-переменная), используя dplyr, Im получая ошибку, и я не совсем уверен, что не так. df.h <- data.frame( hour = factor(rep(1:24, each = 21)), price = runif(504, min = -10, max = 125), wind = runif(504, min = 0, max = 2500), temp = runif(504, min = – […]

Фильтровать фрейм данных по имени столбца символа (в dplyr)

У меня есть кадр данных и вы хотите отфильтровать его одним из двух способов: либо столбцом «это», либо столбцом «это». Я хотел бы иметь возможность ссылаться на имя столбца как на переменную. Как (в dplyr , если это имеет значение) я ссылаюсь на имя столбца переменной? library(dplyr) df % filter(this == 1) # this that […]

Создать столбец с группируемыми значениями на основе другого столбца

Я уверен, что это было задано раньше, но я не знаю, что искать, поэтому заранее извиняюсь. Предположим, что у меня есть следующий фрейм данных: grades <- data.frame(a = 1:40, b = sample(45:100, 40)) Используя deplyr, я хочу создать новую переменную, которая указывает оценку, полученную учащимся, исходя из следующих критериев: 90-100 = отлично, 80-90 = очень […]

Выполнение dplyr mutate на подмножестве столбцов

У меня есть data.frame, такой как это (реальный dataset имеет гораздо больше строк и столбцов) set.seed(15) dd <- data.frame(id=letters[1:4], matrix(runif(5*4), nrow=4)) # id X1 X2 X3 X4 X5 # 1 a 0.6021140 0.3670719 0.6872308 0.5090904 0.4474437 # 2 b 0.1950439 0.9888592 0.8314290 0.7066286 0.9646670 # 3 c 0.9664587 0.8151934 0.1046694 0.8623137 0.1411871 # 4 d […]

dplyr :: group_by_ с символьной строкой ввода нескольких имен переменных

Я пишу функцию, в которой пользователю предлагается определить одну или несколько переменных группировки в вызове функции. Затем данные группируются с использованием dplyr, и он работает как ожидалось, если имеется только одна переменная группировки, но я не понял, как это сделать с несколькими переменными группировки. Пример: x <- c("cyl") y <- c("cyl", "gear") dots % group_by_(x) […]

Фильтрация нескольких значений в столбце строки в dplyr

У меня есть data.frame с символьными данными в одном из столбцов. Я хотел бы отфильтровать несколько параметров в data.frame из того же столбца. Есть ли простой способ сделать это, что мне не хватает? Пример: имя data.frame = dat days name 88 Lynn 11 Tom 2 Chris 5 Lisa 22 Kyla 1 Tom 222 Lynn 2 […]

фильтр для полных случаев в data.frame с использованием dplyr (случайное удаление)

Можно ли отфильтровать data.frame для полных случаев с использованием dplyr? Конечно, заполняются все номера со списком всех переменных. Но это a) подробный, когда есть много переменных, и b) невозможно, если имена переменных неизвестны (например, в функции, обрабатывающей любой файл data.frame). library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.% filter(complete.cases(x1,x2))

Передавать аргументы функции dplyr

Я хочу параметризовать следующее вычисление, используя dplyr который находит, какие значения Sepal.Length связаны с более чем одним значением Sepal.Width : library(dplyr) iris %>% group_by(Sepal.Length) %>% summarise(n.uniq=n_distinct(Sepal.Width)) %>% filter(n.uniq > 1) Обычно я писал бы что-то вроде этого: not.uniq.per.group % group_by(group.var) %>% summarise(n.uniq=n_distinct(uniq.var)) %>% filter(n.uniq > 1) } Однако этот подход вызывает ошибки, поскольку dplyr использует […]

Выберите первую и последнюю строку из сгруппированных данных

Вопрос Используя dplyr , как выбрать верхний и нижний наблюдения / строки сгруппированных данных в одном выражении? Данные и пример Учитывая структуру данных df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Я могу получить верхние и нижние наблюдения из каждой группы, используя slice , но используя две отдельные записи: firstStop % group_by(id) %>% arrange(stopSequence) %>% slice(1) %>% ungroup […]

Может ли dplyr суммировать несколько переменных без enums каждого из них?

dplyr удивительно быстрый, но мне интересно, не хватает ли я чего-то: возможно ли это обобщение по нескольким переменным. Например: library(dplyr) library(reshape2) (df=dput(structure(list(sex = structure(c(1L, 1L, 2L, 2L), .Label = c(“boy”, “girl”), class = “factor”), age = c(52L, 58L, 40L, 62L), bmi = c(25L, 23L, 30L, 26L), chol = c(187L, 220L, 190L, 204L)), .Names = c(“sex”, […]

Interesting Posts

Как у вас пародия на пару секунд в андроиде?

Как быстро формировать группы (квартили, децили и т. Д.) Путем упорядочения столбцов (ов) в кадре данных

Изменить значок DOCX

Обновление Java «Не удалось загрузить необходимые установочные файлы».

Как сгенерировать случайное число в диапазоне (10 … 20) с помощью Swift

Wake on Lan работает из локальной сети, но не WAN

Как выполнить файл dex в android с помощью команды?

Можете ли вы предлагать VNC-соединения через туннель SSH или сеанс, который вы начали?

Почему плохое отображение сетевых дисков в Windows?

Установка Vim в Cygwin

Установка даты создания файла в Mac OS X

Исправление проблемы библиотеки на E71

Почему SDL определяет основной макрос?

Как отключить форматирование цвета строки URL в Firefox 6?

Какой смысл перегружать методы фабрики удобство для коллекций в Java 9

Давайте будем гением компьютера.