Как удалить все дубликаты, чтобы NONE остался в фрейме данных?

Аналогичный вопрос для PHP существует, но я работаю с R и не могу перевести решение моей проблемы.

У меня есть этот кадр данных с 10 строками и 50 столбцами, где некоторые из строк абсолютно идентичны. Если я использую уникальную на нем, я получаю одну строку – скажем – «тип», но я действительно хочу получить только те строки, которые появляются только один раз. Кто-нибудь знает, как я могу это достичь?

Я могу взглянуть на кластеры и тепловые карты, чтобы разобраться в них вручную, но у меня больше кадров данных, чем упомянутый выше (с до 100 строк), где это немного сложно.

Это приведет к извлечению строк, которые появляются только один раз (при условии, что ваш фрейм данных называется df ):

 df[!(duplicated(df) | duplicated(df, fromLast = TRUE)), ] 

Как это работает : функция duplicated проверяет, появляется ли строка, по крайней мере, второй раз, начиная с первой строки. Если используется аргумент fromLast = TRUE , функция начинается с последней строки.

Оба логических результата объединены с | (логический «или») в новый вектор, который указывает все строки, появляющиеся более одного раза. Результат этого отрицается с помощью ! тем самым создавая логические строки, указывающие строки, появляющиеся только один раз.

Interesting Posts
Давайте будем гением компьютера.