Список всех файлов, соответствующих шаблону полного пути в R

Я пытаюсь получить список файлов, соответствующих шаблону полного пути . До сих пор я использовал list.files (), но это не сработало.

Предположим, что у нас есть следующая организация каталогов:

results |- A | |- data-1.csv | |- data-2.csv | |- B |- data-1.csv |- data-2.csv 

Затем выполните команду:

 list.files(pattern='data-.*\\.csv', recursive=TRUE) 

вернет все файлы, соответствующие шаблону. Это работает, но проблема возникает при использовании шаблона полного пути . Например, если я хочу получить все CSV-файлы из результатов каталога / A , я мог бы сделать:

 list.files(pattern='results/A/data-.*\\.csv', recursive=TRUE) 

Это не работает. Так или иначе, похоже, что R не может использовать шаблон полного пути в качестве регулярного выражения. В этом случае решением может быть просто использовать результаты / A в качестве базового пути. Но в более сложных проблемах это невозможно. Например, в какой-то момент мы можем захотеть сопоставить подкаталоги, содержащие только символы:

 list.files(pattern='results/[AZ]+/data-.*\\.csv', recursive=TRUE) 

Можно ли это сделать в R?

ОБНОВЛЕНИЕ: после использования ad hoc-решений некоторое время я решил прекратить печатать снова и снова. Итак, я создал библиотеку для упрощения этой задачи.

Во-первых, обратите внимание, что вы не используете шаблоны регулярных выражений. Ваш первый пример должен быть:

 list.files(pattern='data-.*\\.csv', recursive=TRUE) 

Затем кажется, что шаблон, сопоставляемый внутри list.files , применяется к list.files файлов (т. list.files Не включая путь к каталогу), поэтому вы можете разбить задачу на:

  1. Найти все файлы, соответствующие только basename, вернуть их полный путь:

     basename.matches <- list.files(pattern='data-.*\\.csv', recursive=TRUE, full.names = TRUE) basename.matches # [1] "./results/A/data-1.csv" "./results/A/data-2.csv" "./results/B/data-1.csv" # [4] "./results/B/data-2.csv" 
  2. Храните только те, которые соответствуют ожидаемой директории (-ий):

     full.matches <- grep(pattern='^\\./results/A/', basename.matches, value = TRUE) full.matches # [1] "./results/A/data-1.csv" "./results/A/data-2.csv" 

Вы не можете сделать это только с помощью list.files потому что он перебирает каждый элемент в path и применяет регулярное выражение к содержащимся в нем файлам. Но поскольку аргумент path для list.files может принимать вектор, вы можете использовать его для решения своей проблемы.

 dirs <- grep("[AZ]+$",list.dirs("results",recursive=FALSE),value=TRUE) list.files(dirs, "data-.*\\.csv", recursive=TRUE, full.names=TRUE) 

Я думаю, что есть еще более простое решение:

Sys.glob(file.path(results, "[AZ]", "data-*.csv"))

я буду использовать

 paths <- list.files(results, pattern= glob2rx("*data-*.csv$*"), full.names=T, recursive=T) 
  • C #, регулярные выражения: как анализировать значения, разделенные запятыми, где некоторые значения могут быть указаны как строки, содержащие запятые
  • Регулярное выражение, которое не содержит определенной строки
  • Как напечатать соответствие шаблону регулярного выражения с помощью awk?
  • Java regex: Повторяющиеся группы захвата
  • Разбор CN из сертификата DN
  • Соответствие строк с помощью шаблона
  • совпадение совпадений java regex
  • Как Stack Overflow генерирует свои SEO-дружественные URL-адреса?
  • Как использовать регулярные выражения в сценариях bash?
  • Заменить первое вхождение шаблона в строку
  • Шаблон Java Regex, который соответствует любому онлайн-тестеру, но не в Eclipse
  • Interesting Posts

    Netstat с именем процесса?

    Как загрузить изображение в синтаксический анализатор, используя parse api в android

    Как работает jQuery .data ()?

    Можно ли использовать GPU для повышения производительности компьютера автоматически?

    Какие форматы архивных файлов обеспечивают защиту от повреждения файлов?

    Нужно ли закрывать каждый вложенный OutputStream и Writer отдельно?

    Как скопировать вывод файлового менеджера FAR

    System.BadImageFormatException Была сделана попытка загрузить программу с неправильным форматом

    Почему изображение, захваченное с использованием намерения камеры, вращается на некоторых устройствах на Android?

    Intel turbo boost – на самом деле

    Удаление главного пароля ATA

    Как получить объект Date из json Response в машинописном тексте

    C # Generics не допускает ограничений типа делегата

    Что такое PECS (продюсер продлевает потребительский супер)?

    Создание раздела спящего режима в Windows 7

    Давайте будем гением компьютера.