Кой е най-добрият начин за създаване на азбучно сортиран списък в Python?
Основен отговор:
mylist = ["b", "C", "A"]
mylist.sort()
Това променя първоначалния ви списък (т.е. сортира на място). За да получите сортирано копие на списъка, без да променяте оригинала, използвайте функцията sorted()
:
for x in sorted(mylist):
print x
Въпреки това горните примери са малко наивни, защото не вземат предвид локалите и извършват сортиране, чувствително към малки и големи букви. Можете да се възползвате от незадължителния параметър key
, за да зададете потребителски ред на сортиране (алтернативата, използваща cmp
, е остаряло решение, тъй като трябва да се оценява многократно - key
се изчислява само веднъж за всеки елемент).
И така, да се сортира според текущата локалност, като се вземат предвид специфичните за езика правила (cmp_to_key
е помощна функция от functools):
sorted(mylist, key=cmp_to_key(locale.strcoll))
И накрая, ако е необходимо, можете да посочите custom locale за сортиране:
import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']
Последна забележка: ще видите примери за сортиране без отчитане на големи и малки букви, които използват метода lower()
- те са неправилни, защото работят само за подмножеството ASCII символи. Тези два метода са неправилни за всякакви данни, които не са на английски език:
# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)
Но как се справят с правилата за сортиране, специфични за езика? Взема ли се предвид локалът?
Не, list.sort()
е обща функция за сортиране. Ако искате да сортирате в съответствие с правилата на Unicode, ще трябва да дефинирате потребителска функция за сортиране на ключове. Можете да опитате да използвате модула pyuca, но не знам доколко е завършен.