Аlgoritam upoređivanja Unicode-a
Algoritam upoređivanja Unicode-a (engl. Unicode collation algorithm, UCA) algoritam je opisan u njegovom tehničkom izveštaju br. 10 koji definiše prilagodljive metode za poređenje dve niske. Ta poređenja se potom mogu koristiti za sređivanje ili sortiranje teksta u bilo kom pisanom sistemu ili jeziku predstavljenom u Unicode-u.
Tehnički izveštaj Unicode-a br. 10 precizira Podrazumevanu tabelu elemenata upoređivanja Unicode-a (engl. Default Unicode Collation Element Table, DUCET). Ova datoteka podataka određue podrazumevani redosled svrstavanja. DUCET je prilagodiv različitim jezicima. Mnoga takva prilagođavanja mogu se naći u Zajedničkom lokalnom skladištu podataka (engl. Common Locale Data Repository, CLDR).
Važna implementacija otvorenog koda UCA uključena je u Međunarodne komponente Unicode-a (engl. International Components for Unicode, ICU). ICU podrazumeva i upoređivanje i sređivanje iz CLDR je uključeno u ICU. U Lokalnom istražicaču ICU-a (engl. ICU Locale Explorer) mogu se videti dejstva sređivanja i veliki broj posebnih jezičkih upoređivanja.
Spoljašnje veze
[уреди | уреди извор]- Tehnički standard Unicode-a br. 10
- Tabele Mimer SQL-a kolacije Unicode-{-a
- Tabele MySQL-a kolacije Unicode-a zasnovane na UCA
- Demonstracija algoritma upoređivanja Unicode-a na internetu uz korišćenje ICU Архивирано на сајту Wayback Machine (11. мај 2008)
- msort — program za sortiranje koji pruža neobičan nivo fleksibilnosti u definisanju upoređivanja i izdvajanja ključeva
- OpenRTL — biblioteka funkcija koristi upoređivanja Unicode-a zasnovana na algoritmu. Podržava i prilagođena upoređivanja za lokale koje definiše CLDR