Tag: r

Написание надежного R-кода: пространства имен, маскирование и использование оператора `::`

Укороченная версия Для тех, кто не хочет читать мой «случай», в этом суть: Каков рекомендуемый способ минимизации возможностей новых пакетов, нарушающих существующий код, т. Е. Сделать код, который вы пишете как можно более надежным ? Каков рекомендуемый способ наилучшего использования механизма пространства имен, когда a) просто используя предоставленные пакеты (скажем, только в каком-то R-аналитическом проекте)? […]

Построение нескольких временных рядов на одном и том же участке с использованием ggplot ()

Я довольно новичок в R и пытаюсь построить две линии временных рядов одновременно (используя разные цвета, конечно), используя ggplot2. У меня есть 2 кадра данных. первый имеет столбцы «Процент изменения для X» и «Дата». Второй вариант имеет «Процентное изменение для столбцов Y» и «Дата», то есть оба столбца «Дата» имеют одинаковые значения, тогда как столбцы […]

Построение интерполированных данных на карте

У меня есть данные обследований по видовому богатству, которые были взяты на разных участках в заливе Чесапик, США, и я хотел бы графически представить данные в виде «карты тепла». У меня есть dataframe значений lat / long координат и значений богатства, которые я преобразовал в SpatialPointsDataFrame и использовал autoKrige() из пакета automap для генерации интерполированных […]

Установите определенные значения в NA с помощью dplyr

Я пытаюсь найти простой способ сделать что-то подобное с помощью dplyr (data set = dat, variable = x): day$x[dat$x<0]=NA Должно быть простым, но это лучшее, что я могу сделать в данный момент. Есть ли более простой способ? dat = dat %>% mutate(x=ifelse(x<0,NA,x))

Подсчитайте количество записей и создайте номер строки в каждой группе в таблице данных.

У меня есть следующие данные.table set.seed(1) DT <- data.table(VAL = sample(c(1, 2, 3), 10, replace = TRUE)) VAL 1: 1 2: 2 3: 2 4: 3 5: 1 6: 3 7: 3 8: 2 9: 2 10: 1 В каждом номере VAL я хочу: Подсчитайте количество записей / строк Создайте индекс строки (счетчик) первого, второго, […]

Декартовы данные продукта в R

Я имею три или более независимых переменных, представленных как R-векторы, например: A <- c(1,2,3) B <- factor(c('x','y')) C <- c(0.1,0.5) и я хочу взять декартово произведение всех из них и поместить результат в кадр данных, например: ABC 1 x 0.1 1 x 0.5 1 y 0.1 1 y 0.5 2 x 0.1 2 x 0.5 […]

Многострочные методы обхода комментариев?

Я (вроде) уже знаю ответ на этот вопрос. Но я подумал, что это вопрос, который так часто задают в списке пользователей R, что должен быть один солидный хороший ответ. Насколько я знаю, в RR нет многострочной функции комментариев. Итак, есть ли у кого-нибудь хорошие способы обхода? В то время как довольно много работы в R […]

Геометрическое среднее: есть ли встроенный?

Я попытался найти встроенный геометрический инструмент, но не смог. (Очевидно, что встроенный не собирается меня спасать во время работы в оболочке, и я также не подозреваю, что есть какая-то разница в точности; для скриптов я стараюсь использовать встроенные модули как можно чаще, где (кумулятивный) прирост производительности часто заметен. Если нет никого (что я сомневаюсь в […]

Методы поиска близлежащих дубликатов записей

Я пытаюсь очистить базу данных, которая на протяжении многих лет приобретала много дубликатов записей с немного разными именами. Например, в таблице компаний есть такие имена, как «Some Company Limited» и «НЕКОТОРАЯ КОМПАНИЯ LTD!». Мой план заключался в том, чтобы экспортировать таблички с нарушениями в R, конвертировать имена в нижний регистр, заменить обычные синонимы (например, «limited» […]

Ошибка DocumentTermMatrix в аргументе Corpus

У меня есть следующий код: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, tolower) corpus_clean <- tm_map(corpus_clean, removeNumbers) corpus_clean <- tm_map(corpus_clean, removeWords, stopwords('english')) corpus_clean <- tm_map(corpus_clean, removePunctuation) corpus_clean <- tm_map(corpus_clean, stripWhitespace) corpus_clean <- tm_map(corpus_clean, trim) news_dtm <- […]

Давайте будем гением компьютера.