Как разбирать очень большие XML-файлы в C #?
Я работаю с dblp XML-файлами. Я действительно хочу проанализировать файл dblp.xml и хочу извлечь полезную информацию для дальнейшей обработки в каком-то проекте. И этот XML-файл очень большой (1,1 ГБ), и я не могу даже открыть этот файл.
Прошу вас посоветуйте, если у вас есть парсер C # для dblp.xml или вы можете посоветовать мне об этом или о том, как мы можем разобрать огромные xml-файлы.
- Создание XML-файла с использованием java
- Подавлять типы нулевых значений от испускания XmlSerializer
- Какую библиотеку Java XML вы рекомендуете (чтобы заменить dom4j)?
- Получение значения атрибута в элементе xml
- android.content.res.Resources $ NotFoundException: Идентификатор ресурса строки # 0x0
- Определение Z порядка просмотров RelativeLayout в Android
- Объединение XML-документов
- Параметры макета Android XML не работают, как ожидалось
- Как перехватывать защищенные страницы в R (https-ссылки) (используя readHTMLTable из пакета XML)?
- Как создать панель кнопок верхнего или нижнего колонтитула для приложения для Android
- Как сериализовать / десериализовать простые classы в XML и обратно
- Значение -
- Как получить выбранный индекс RadioGroup в Android
Используйте XML-ридер вместо XML dom. XML dom хранит весь файл в памяти, который абсолютно бесполезен:
http://msdn.microsoft.com/en-us/library/system.xml.xmlreader.aspx
Вам нужно использовать XmlReader
Он представляет собой считыватель, который обеспечивает быстрый, не кэшированный, прямой доступ к XML
данным. Не будет загружать все данные в память , которые предполагается использовать с большими наборами данных. Другие встроенные .NET
решения сохраняют полный граф объектов.
XmlReader в действии (Джон Скит)