Tag: r

Факторы в R: больше, чем раздражение?

Одним из основных типов данных в R является фактор. По моему опыту, в основном это боль, и я никогда их не использую. Я всегда перехожу к персонажам. Мне странно кажется, что я что-то упускаю. Существуют ли некоторые важные примеры функций, которые используют факторы как группирующие переменные, где необходим факторный тип данных? Существуют ли конкретные обстоятельства, […]

Как удалить строки в фрейме данных?

У меня есть кадр данных с именем «mydata», который выглядит так: ABCD 1. 5 4 4 4 2. 5 4 4 4 3. 5 4 4 4 4. 5 4 4 4 5. 5 4 4 4 6. 5 4 4 4 7. 5 4 4 4 Я хотел бы удалить строку 2,4,6. Например, например: […]

Уменьшить размер файлов PDF-файлов путем фильтрации скрытых объектов

Производя графики рассеяния многих точек в R (например, используя ggplot() ), может быть много точек, которые находятся за остальными и вообще не видны. Например, см. График ниже: Это график рассеяния в несколько сотен тысяч точек, но большинство из них находятся за другими точками. Проблема заключается в том, что выставляя вывод в векторный файл (например, в […]

Случайно вставляйте NA в пропорциональную пропорцию данных

У меня есть полный фрейм. Я хочу, чтобы 20% значений в фрейме данных были заменены на НС, чтобы имитировать случайные отсутствующие данные. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C) Может ли кто-нибудь предложить быстрый способ сделать это?

обработка отрицательного числа в формате «учета»

У меня есть dataset, отрицательное значение которого представлено скобкой вокруг числа ie (10)==-10 , оно находится в формате csv, как я могу обработать его так, чтобы R интерпретировал (10) как -10 ? Спасибо. ОБНОВЛЕНИЕ Я знаю, что я могу это решить, заменив ( как – , удалить ) и использовать as.numeric впоследствии, но есть ли […]

Использование Reshape с широким и длинным в R

Я пытаюсь переделать данные с широких длинными в R. мои данные в широком формате выглядят так: У меня есть следующая matrix данных: в строках у меня разные компании, а в столбцах с разными переменными разных лет. (заработок_2012, заработок_2011, заработок_2010, …, tot_assets_2012, tot_assets_2011 и т. д. Я хотел бы переставить это в длинный формат: имея только […]

Как мы можем создавать графики стиля xkcd?

По-видимому, люди выяснили, как создавать графики стиля xkcd в Mathematica и LaTeX . Можем ли мы сделать это в R? Ggplot2-ERS? Geom_xkcd и / или theme_xkcd? Думаю, в базовой графике, par (xkcd = TRUE)? Как мне это сделать? В качестве первого удара (и, что более элегантно показано ниже) в ggplot2, добавление аргумента дрожания в строку […]

замените значение NA на значение группы

У меня есть df следующим образом, у которого 20 человек в 5 домашних хозяйствах. У некоторых людей в домохозяйстве отсутствуют данные о том, есть ли у них карточка med_card или нет. Я хочу дать этим людям такую ​​же ценность, как и другие люди в их доме (не значение NA, реальное двоичное значение, которое равно 0 […]

Как конвертировать R Markdown в PDF?

Ранее я спросил о командах для преобразования R Markdown в HTML . Что такое хороший способ конвертировать файлы R Markdown в документы PDF? Хорошее решение позволит сохранить как можно больше контента (например, изображения, уравнения, таблицы html и т. Д.). Решение должно быть выполнено из командной строки. Хорошее решение также будет кросс-платформенным и идеально минимизировать зависимости, […]

Как читать файл csv в R, где некоторые значения содержат символ процента (%)

Есть ли чистый / автоматический способ преобразования значений CSV, отформатированных в процентах (с конечным символом % ) в R? Вот некоторые примеры данных: actual,simulated,percent error 2.1496,8.6066,-300% 0.9170,8.0266,-775% 7.9406,0.2152,97% 4.9637,3.5237,29% Что можно прочитать, используя: junk = read.csv(“Example.csv”) Но все столбцы% читаются как строки и преобразуются в факторы: > str(junk) ‘data.frame’: 4 obs. of 3 variables: $ […]

Давайте будем гением компьютера.