Буквенно-цифровая сортировка с использованием LINQ

У меня есть string[] в которой каждый элемент заканчивается некоторым числовым значением.

 string[] partNumbers = new string[] { "ABC10", "ABC1","ABC2", "ABC11","ABC10", "AB1", "AB2", "Ab11" }; 

Я пытаюсь сортировать вышеуказанный массив следующим образом, используя LINQ но я не получаю ожидаемого результата.

 var result = partNumbers.OrderBy(x => x); 

Фактический результат:

AB1
AB11
АВ2
АВС1
ABC10
ABC10
ABC11
ABC2

ожидаемый результат

AB1
АВ2
AB11
..

Это связано с тем, что упорядочение по умолчанию для строки является стандартным буквенно-цифровым словарным (лексикографическим) заказом, а ABC11 будет предшествовать ABC2, потому что упорядочение всегда происходит слева направо.

Чтобы получить то, что вы хотите, вам нужно вставить числовую часть в ваш заказ по предложению, например:

  var result = partNumbers.OrderBy(x => PadNumbers(x)); 

где PadNumbers можно определить как:

 public static string PadNumbers(string input) { return Regex.Replace(input, "[0-9]+", match => match.Value.PadLeft(10, '0')); } 

Это выравнивает нули для любого числа (или чисел), которые появляются во входной строке, чтобы OrderBy видел:

 ABC0000000010 ABC0000000001 ... AB0000000011 

Прокладка происходит только на клавише, используемом для сравнения. Исходные строки (без заполнения) сохраняются в результате.

Обратите внимание, что этот подход предполагает максимальное количество цифр для чисел на входе.

Правильная реализация алфавитно-цифрового метода сортировки, который «работает», можно найти на сайте Дэйва Коэля . Версия C # находится здесь .

 public class AlphanumComparatorFast : IComparer { List GetList(string s1) { List SB1 = new List(); string st1, st2, st3; st1 = ""; bool flag = char.IsDigit(s1[0]); foreach (char c in s1) { if (flag != char.IsDigit(c) || c=='\'') { if(st1!="") SB1.Add(st1); st1 = ""; flag = char.IsDigit(c); } if (char.IsDigit(c)) { st1 += c; } if (char.IsLetter(c)) { st1 += c; } } SB1.Add(st1); return SB1; } public int Compare(object x, object y) { string s1 = x as string; if (s1 == null) { return 0; } string s2 = y as string; if (s2 == null) { return 0; } if (s1 == s2) { return 0; } int len1 = s1.Length; int len2 = s2.Length; int marker1 = 0; int marker2 = 0; // Walk through two the strings with two markers. List str1 = GetList(s1); List str2 = GetList(s2); while (str1.Count != str2.Count) { if (str1.Count < str2.Count) { str1.Add(""); } else { str2.Add(""); } } int x1 = 0; int res = 0; int x2 = 0; string y2 = ""; bool status = false; string y1 = ""; bool s1Status = false; bool s2Status = false; //s1status ==false then string ele int; //s2status ==false then string ele int; int result = 0; for (int i = 0; i < str1.Count && i < str2.Count; i++) { status = int.TryParse(str1[i].ToString(), out res); if (res == 0) { y1 = str1[i].ToString(); s1Status = false; } else { x1 = Convert.ToInt32(str1[i].ToString()); s1Status = true; } status = int.TryParse(str2[i].ToString(), out res); if (res == 0) { y2 = str2[i].ToString(); s2Status = false; } else { x2 = Convert.ToInt32(str2[i].ToString()); s2Status = true; } //checking --the data comparision if(!s2Status && !s1Status ) //both are strings { result = str1[i].CompareTo(str2[i]); } else if (s2Status && s1Status) //both are intergers { if (x1 == x2) { if (str1[i].ToString().Length < str2[i].ToString().Length) { result = 1; } else if (str1[i].ToString().Length > str2[i].ToString().Length) result = -1; else result = 0; } else { int st1ZeroCount=str1[i].ToString().Trim().Length- str1[i].ToString().TrimStart(new char[]{'0'}).Length; int st2ZeroCount = str2[i].ToString().Trim().Length - str2[i].ToString().TrimStart(new char[] { '0' }).Length; if (st1ZeroCount > st2ZeroCount) result = -1; else if (st1ZeroCount < st2ZeroCount) result = 1; else result = x1.CompareTo(x2); } } else { result = str1[i].CompareTo(str2[i]); } if (result == 0) { continue; } else break; } return result; } } 

ИСПОЛЬЗОВАНИЕ этого classа:

  List marks = new List(); marks.Add("M'00Z1"); marks.Add("M'0A27"); marks.Add("M'00Z0"); marks.Add("0000A27"); marks.Add("100Z0"); string[] Markings = marks.ToArray(); Array.Sort(Markings, new AlphanumComparatorFast()); 

Если вы хотите отсортировать список объектов по определенному свойству с помощью LINQ и пользовательского сопоставителя, такого как Dave Koelle, вы сделали бы что-то вроде этого:

 ... items = items.OrderBy(x => x.property, new AlphanumComparator()).ToList(); ... 

Вам также необходимо изменить class Dave для наследования из System.Collections.Generic.IComparer вместо основного IComparer чтобы подпись classа стала:

 ... public class AlphanumComparator : System.Collections.Generic.IComparer { ... 

Лично я предпочитаю реализацию Джеймсом Маккормаком, потому что он реализует IDisposable, хотя мой бенчмаркинг показывает, что он немного медленнее.

Вы можете использовать PInvoke для быстрого и хорошего результата:

 class AlphanumericComparer : IComparer { [DllImport("shlwapi.dll", CharSet = CharSet.Unicode)] static extern int StrCmpLogicalW(string s1, string s2); public int Compare(string x, string y) => StrCmpLogicalW(x, y); } 

Вы можете использовать его как AlphanumComparatorFast из приведенного выше ответа.

Вы можете использовать PInvoke для StrCmpLogicalW (функция windows) для этого. См. Здесь: Природный порядок сортировки в C #

Хорошо похоже, что он делает лексикографическое оформление независимо от мелких или капитальных символов.

Вы можете попробовать использовать какое-то пользовательское выражение в этой лямбде, чтобы сделать это.

В .NET нет естественного способа сделать это, но посмотрите на это сообщение в блоге по естественной сортировке

Вы можете поместить это в метод расширения и использовать это вместо OrderBy

Поскольку число символов в начале является переменной, регулярное выражение помогло бы:

 var re = new Regex(@"\d+$"); // finds the consecutive digits at the end of the string var result = partNumbers.OrderBy(x => int.Parse(re.Match(x).Value)); 

Если было фиксированное число префиксных символов, вы можете использовать метод Substring для извлечения, начиная с соответствующих символов:

 // parses the string as a number starting from the 5th character var result = partNumbers.OrderBy(x => int.Parse(x.Substring(4))); 

Если числа могут содержать разделитель десятичных чисел или разделитель тысяч, то регулярное выражение должно также допускать эти символы:

 var re = new Regex(@"[\d,]*\.?\d+$"); var result = partNumbers.OrderBy(x => double.Parse(x.Substring(4))); 

Если строка, возвращаемая регулярным выражением или Substring может быть недоступна с помощью int.Parse / double.Parse , используйте соответствующий вариант TryParse :

 var re = new Regex(@"\d+$"); // finds the consecutive digits at the end of the string var result = partNumbers.OrderBy(x => { int? parsed = null; if (int.TryParse(re.Match(x).Value, out var temp)) { parsed = temp; } return parsed; }); 

Я не знаю, как это сделать в LINQ, но, возможно, вам это нравится:

 Array.Sort(partNumbers, new AlphanumComparatorFast()); 

// Отображение результатов

 foreach (string h in partNumbers ) { Console.WriteLine(h); } 
  • Как сортировать список по свойству в объекте
  • как сортировать строку как число в datagridview в winforms
  • Как команда сортировки UNIX может сортировать очень большой файл?
  • Оптимальный алгоритм для возврата значений верхнего k из массива длины N
  • Лучший способ сделать сортировку WPF ListView / GridView при нажатии на заголовок столбца?
  • Сортировка std :: строк с номерами в них?
  • Пользовательская логика сортировки в OrderBy с использованием LINQ
  • Найти пару через 2 массива с k-й наибольшей суммой
  • Алгоритм естественной сортировки
  • Сортировка массива объектов SimpleXML
  • Быстрая реализация алгоритма для сортировки очень малого списка
  • Давайте будем гением компьютера.