Tag: r

Наложение двух графиков ggplot2 stat_density2d с альфа-каналами

Я хочу наложить два ggplot2 с альфа-каналами таким образом, чтобы в полученном изображении отображались оба набора данных. Это мои тестовые данные: data = read.table(text=”P1 -1 0 4\nP2 0 0 2\nP3 2 1 8\nP4 -2 -2 6\nP5 0.5 2 12″) data2 = read.table(text=”Q1 1 1 3\nQ2 1 -1 2\nQ3 -1 1 8″) colnames(data) = c(“name”,”x”,”y”,”score”) colnames(data2) […]

В R-формулах, почему я должен использовать функцию I () на степенных членах, таких как y ~ I (x ^ 3)

Я пытаюсь разобраться в использовании оператора тильды и связанных функций. Мой первый вопрос: почему I() должен использоваться для указания арифметических операторов? Например, эти 2 графика генерируют разные результаты (первая имеет прямую линию, а вторая – ожидаемую кривую) x <- c(1:100) y <- seq(0.1,10,0.1) plot(y~x^3) plot(y~I(x^3)) кроме того, обе следующие графики также генерируют ожидаемый результат plot(x^3, […]

LDA с topicmodels, как я могу видеть, к каким темам относятся разные документы?

Я использую LDA из пакета topicmodels, и я запустил его около 30 000 документов, приобрел 30 тем и получил 10 лучших слов по темам, они выглядят очень хорошо. Но я хотел бы посмотреть, какие документы относятся к какой теме с наивысшей вероятностью, как я могу это сделать? myCorpus <- Corpus(VectorSource(userbios$bio)) docs <- userbios$twitter_id myCorpus <- […]

В R markdown в RStudio, как я могу предотвратить запуск исходного кода PDF-страницы?

В настоящее время у меня есть код, который выглядит так: “`{r, tidy=TRUE} plot(DT$age, DT$height, xlab = “Age of participant in Trials”, ylab = “Height of participant in Trials”) “` Теперь я понял, что настройка в порядке TRUE сделала бы это так, что, когда я вставляю код вместе, код не будет бежать со страницы и будет […]

Несколько ggplots разных размеров

Сравнительно просто использовать grid.arrange в пакете gridExtra для размещения нескольких графиков в матрице, но как вы можете организовать графики (те, над которыми я работаю, из ggplot2 ), когда некоторые сюжеты должны быть больше других? В базе я могу использовать layout() например, в следующем примере: nf <- layout(matrix(c(1,1,1,2,3,1,1,1,4,5,6,7,8,9,9), byrow=TRUE, nrow=3)) layout.show(nf) что эквивалентно ggplot ? Некоторые […]

duplicate ‘row.names’ не допускается ошибка

Я пытаюсь загрузить файл csv, который имеет 14 столбцов: StartDate, var1, var2, var3, …., var14 когда я выдаю эту команду: systems <- read.table("http://getfile.pl?test.csv", header=TRUE, sep=",") Я получаю сообщение об ошибке «duplicate row.names not allowed». Мне кажется, что первое имя столбца вызывает проблему. Когда я вручную загружаю файл и StartDate имя StartDate из файла, R успешно […]

Множество групп ggplot

Я хотел бы знать, как получить 9-сегментный график (3×3) togheter. Мой CSV: data <- read.csv("http://pastebin.com/raw.php?i=6pArn8GL", sep = ";") 9 сюжетов должны быть группами по типу «А-1». Затем каждый график сгруппированных штрихов должен иметь частоту по оси y, ось x сгруппирована на 1 pce до 6 pce и подсекается по году. У меня есть следующий пример […]

Поиск процента в подгруппе с использованием group_by и суммирование

Я новичок в dplyr и стараюсь сделать следующее преобразование без везения. Я искал через Интернет, и я нашел примеры делать то же самое в ddply, но я бы хотел использовать dplyr. У меня есть следующие данные: month type count 1 Feb-14 bbb 341 2 Feb-14 ccc 527 3 Feb-14 aaa 2674 4 Mar-14 bbb 811 […]

Настроить тики x-axis

У меня очень большой фрейм данных (2 столбца) с точки зрения записей. Я построил график в ggplot2. Ось X – это время, а ось Y – значения. В течение определенного промежутка времени от 50 до 60 я хочу, чтобы размеры тиков были меньше, например (50,51,51,53, … 59,60). Для остальной части оси хорошо иметь тики, увеличенные […]

как преобразовать data.frame в транзакции для arules

Я читаю данные из файла csv, данные имеют 3 столбца, один – идентификатор транзакции, два других – товарные и товарные категории. Мне нужно преобразовать это в транзакции, чтобы использовать функцию apriori в arules . При конвертации в транзакции отображается ошибка: dat <- read.csv("spss.csv",head=TRUE,sep="," , as.is = T) dat[,2] <- factor(dat[,2]) dat[,3] <- factor(dat[,3]) spssdat <- […]

Давайте будем гением компьютера.