upload
The Unicode Consortium
Industry: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
Ordinea de o serie de octeți determinate de o arhitectură de calculator.
Industry:Computer; Software
Inversarea ordinul o secvență de octeți.
Industry:Computer; Software
(1) Care sunt conforme cu normele generale pentru codificarea — adică, nu comprimat, compactată sau în orice altă formă specificată de un protocol mai mare. (2) Caracteristică o cartografiere normativ şi sub formă de echivalență menționate în capitolul 3, conformitatea.
Industry:Computer; Software
Un pas în algoritmul pentru forme de normalizare Unicode, în timpul căreia secvenţe descompus se înlocuiesc compozite primare, dacă este posibil.
Industry:Computer; Software
Pornind de la al doilea caracter în caractere codate secvenţă (de o descompunere canonice sau compatibilitatea descompunere) și proceduri secvenţial la caracterul finală, efectuaţi următorii paşi: R1 Caută înapoi (stânga) în secvenţa de caractere codate caracterul c pentru a găsi ultima L Starter anterioare c în secvenţa de caractere. R2 dacă există astfel o L, şi c nu este blocată la L, şi există un p compozit primare care este canonically echivalent cu succesiunea &lt; L, C &gt;, apoi înlocuiţi l p în secvenţa şi ştergeţi c din secvenţă. *Când termină algoritmul, toate Non-blocat perechi canonically echivalentă cu un compozit primar va au fost sistematic înlocuite de cele compozite primare. *Înlocuirea L Starter în R2 necesită continuă să verificaţi caracterele următoare până la caracterul în această poziție nu mai este parte din orice pereche Non-blocat care poate fi înlocuit cu un compozit primare. De exemplu, să presupunem următoarea secvenţă de caractere codate ipotetică: <u>. Nici una din primele trei mărci de combinarea formează un compozit primare cu scrisoare z. cu toate acestea, combinarea patra marca ordine, acută, forma are un compozit primare cu z, și acesta nu este blocată la z. în consecinţă, R2 mandate înlocuirea secvenţa &lt; U + 007A z,... U + 0301 acută &gt; cu &lt; U + 017A z-acută,... &gt;, chiar dacă există trei alte marcaje combinarea care intervin în secvenţa. *Caracterul C şi R1 nu este neapărat un non-starter. Este necesar pentru a verifica toate caracterele în secvenţă, deoarece există secvențe &lt; L, C &gt; unde l și c sunt demaroare, dar există o p compozit primare canonically echivalente cu această ordine. De exemplu, limbile indiene două părţi vocalele au adesea canonice descompuneri în secvenţe de două semne de vocala spaţierea, fiecare dintre care are Canonical_Combining_Class &#61; 0 și care este astfel un Starter prin definiţie. Cu toate acestea, o astfel de secvenţă descompus are un echivalent primare compozit.
Industry:Computer; Software
Un caracter care nu este identică cu său canonic descompunere. Acesta poate fi cunoscut ca un caracter precomposed canonice sau un caracter compozit canonice.Minuscula latină *de exemplu, 00E0 U + o cu mormântul este un personaj decomposable canonice deoarece sale descompunere canonice este <u>secvenţelor. U + 212A Kelvin semn este un personaj decomposable canonice deoarece sale descompunere canonice este U + 004B Majuscula latină K.
Industry:Computer; Software
Maparea la o secvenţă inerent echivalente — de exemplu, cartografiere ä la a + combinarea umlaut. Descompunerea de un caracter sau secvenţa de caractere care rezultă din recursiv aplicarea mapările canonice găsit în baza de date de caractere Unicode, până când nu caractere pot fi descompuse suplimentare, şi apoi nonspacing mărci de reluare a comenzii. *a canonice descompunere nu eliminaţi informaţii de formatare.
Industry:Computer; Software
Două secvenţe de caractere se spune că sunt echivalenți canonice dacă lor completă canonice descompuneri sunt identice. *De exemplu, secvențe &lt; o, combinarea-diaeresis &gt; şi &lt;ö&gt; sunt echivalenți canonice. Canonice echivalența este o proprietate Unicode. It nu trebuie confundat cu specific limbă asamblare sau potrivire, care se pot adăuga alte equivalencies. De exemplu, în limba suedeză, ö este tratată ca o scrisoare complet diferit de la o şi este colaţionate după z. în germană, ö este slab în echivalent de oe şi este comparate cu oe. În engleză, ö este doar un o cu un diacritică care indică faptul că acesta este pronunţată separat la litera precedentă (ca coöperate) şi este comparate cu o. *, prin definiţie, toate canonice echivalent-secvenţe sunt, de asemenea, echivalent-compatibilitate secvenţe.
Industry:Computer; Software
Într-o secvenţă de caractere descompus D, schimb poziţiile de caractere în fiecare pereche Reorderable până când secvenţei conţine nu mai multe perechi de Reorderable. *De fapt, algoritmul comandarea canonice este un fel de bule locale care să garanteze că o descompunere canonice sau o descompunere de compatibilitate va conţine nici o subsequences în care este urmat un marcaj combinarea direct către o altă combinarea marca care are o energetică combinarea Inferioară, diferită de zero *Canonical comandarea este definită prin intermediul aplicarea algoritmul comandarea canonică pentru o întreaga secvenţă descompus. De exemplu, canonice de descompunere a succesiunii <u>ar rezulta în secvenţa &lt; U + 0064 latină Minuscula 0307 d, U + combinarea punct mai sus, U + 0323 combinarea dot mai jos &gt;, o secvență care nu este încă în ordine canonice. Majoritatea descompuneri pentru siruri de caractere Unicode sunt deja în ordine canonice.
Industry:Computer; Software
Un semn care este utilizată pentru a indica modul în care este un text să fie scandat sau cântate.
Industry:Computer; Software