upload
The Unicode Consortium
Industry: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
isCasefolded(X) ist wahr, wenn toCasefold(Y) = Y. * Z. B. isCasefolded("heiss") ist true, und isCasefolded("heiß") ist falsch. * Die abgeleiteten binary-Eigenschaft, die Changes_When_Casefolded in der Datei DerivedCoreProperties.txt in der Datenbank der Unicode-Zeichen aufgeführt ist.
Industry:Computer; Software
Starter fra det andet tegn i kodede tegnsekvensen (fra en kanoniske opdelingstræ eller kompatibilitet opdelingstræ) og fortsætter sekventielt til det endelige tegn, skal du udføre følgende trin: R1 søge tilbage (venstre) i kodede tegnsekvensen fra tegnet c at finde den sidste Starter L forud c i tegnsekvensen. R2, hvis der er sådant et L, og c er ikke blokeret fra L, og der findes en primær sammensatte P, som er canonically svarer til sekvensen &lt; L, C &gt;, og derefter erstatte l ved p i sekvensen og slette c fra sekvensen. *Når algoritmen afslutter, alle ikke-spærrede par canonically svarende til en primær sammensatte vil systematisk er blevet erstattet af disse primære Composites. *Kræver udskiftning af den Starter L i R2 fortsætter med at kontrollere de efterfølgende tegn, indtil tegnet på denne holdning er ikke længere del af enhver ikke-spærrede par, der kan erstattes af en primær sammensat. Eksempelvis overveje følgende hypotetiske kodede tegnsekvensen: <u>. Ingen af de tre første kombinere varemærker danner en primær sammensat med brev z. dog, det fjerde kombinere varemaerke i sekvensen, akut, betyder formular en primær sammensat med z, og det ikke er blokeret fra z. derfor, R2 mandater udskiftning af sekvensen &lt; U + 007A z,... U + 0301 akut &gt; med &lt; U + 017A z-akut,... &gt;, selv om der er tre andre kombinere mærker intervenerer i sekvensen. *Tegnet C i R1 er ikke nødvendigvis en ikke starter. Det er nødvendigt at kontrollere alle tegn i sekvensen, fordi der er sekvenser &lt; L, C &gt; hvor både l og c er startere, men der er en primær sammensatte P, hvilket canonically svarer til denne sekvens. Eksempelvis indiske todelt vokaler har ofte kanoniske decompositions i sekvenser af to afstand vokalen tegn, som hver har Canonical_Combining_Class &#61; 0, og som er således en Starter pr. definition. Alligevel, sådan en nedbrudt sekvens har en tilsvarende primære sammensat.
Industry:Computer; Software
Indian Standard Codes für Information Interchange (ISCII) Standard ist eine Unicode-Code für die Darstellung verschiedener Schriftsysteme von Indien. Codiert die Zeichen der wichtigsten indischen Skripten die beinhalten: Assamesisch, Bengali (Bengla), Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil und Telugu. ISCII codiert nicht die Schriftsysteme von Indien basierend auf Arabisch, aber seine Schriftsystem switching Code dennoch für Kashmiri, Sindhi, Urdu, Persisch, Paschtu und Arabisch zur Verfügung stellen. Schreiben die Arabisch-basierten Systeme wurden anschließend in der PASCII kodiert Codierung.
Industry:Computer; Software
isLowercase(X) ist wahr, wenn toLowercase(Y) &#61; Y. * Z. B. IsLowercase ("Kombination von Mark") ist true, und IsLowercase ("Combining Mark") ist falsch. * Die abgeleiteten binary-Eigenschaft, die Changes_When_Lowercased in der Datei DerivedCoreProperties.txt in der Datenbank der Unicode-Zeichen aufgeführt ist.
Industry:Computer; Software
isTitlecase(X) ist wahr, wenn toTitlecase(Y) &#61; Y. * Z. B. IsTitlecase ("Combining Mark") ist true, und IsTitlecase ("Combining Mark") ist falsch. * Die abgeleiteten binary-Eigenschaft, die Changes_When_Titlecased in der Datei DerivedCoreProperties.txt in der Datenbank der Unicode-Zeichen aufgeführt ist.
Industry:Computer; Software
Et tegn, der ikke er identisk med dens kanoniske opdelingstræ. Det kan også være kendt som et kanoniske forudsammensat tegn eller en kanoniske sammensatte tegn. *Eksempelvis U + 00E0 Latin lille begyndelsesbogstav en med grav er en kanoniske decomposable karakter, fordi dens kanoniske opdelingstræ er til sekvensen <u>. U + 212A Kelvin tegn er et kanoniske decomposable tegn, fordi dens kanoniske opdelingstræ er til U + 004B Latin capital letter K.
Industry:Computer; Software
Kortlægning til en ifølge sagens natur tilsvarende sekvens — f.eks. kortlægning ä til a + kombinere omlyd. Nedbrydning af et tegn eller tegnsekvens, der resulterer fra rekursivt anvender de kanoniske tilknytninger fundet i Unicode Character Database, indtil ingen tegn kan opdeles yderligere, og derefter genbestillingsmetode nonspacing varemærker. *a kanoniske opdelingstræ fjerner ikke formateringsoplysninger.
Industry:Computer; Software
To tegnsekvenser siges at være kanoniske ækvivalenter, hvis deres fulde kanoniske decompositions er identiske. *Eksempelvis sekvenser &lt; o, kombinere-diaeresis &gt; og &lt;ö&gt; er kanoniske ækvivalenter. Kanoniske ækvivalens er en Unicode-egenskab. Det må ikke forveksles med sprogspecifikke sortering eller matching, som kan tilføje andre equivalencies. For eksempel på svensk, ö behandles som et helt andet brev fra o og er Sætvis sorteret efter z. i tysk, ö er svagt svarende til oe og er sætvis med oe. i engelsk, ö er blot en o med et diakritisk tegn, der angiver, at det udtales separat fra det forrige brev (som coöperate) og er sætvis med o. *pr. definition, alle kanoniske-tilsvarende sekvenser er også kompatibilitet-tilsvarende sekvenser.
Industry:Computer; Software
Udveksle holdninger af tegn i hvert Reorderable par i en nedbrudt tegnsekvens D, indtil sekvensen indeholder ingen mere Reorderable par. *i kraft den kanoniske bestilling algoritme er en lokale boble sortere, der garanterer, at en kanoniske dekomponering eller en kompatibilitet funktionsopdeling vil indeholde nogen subsequences, hvori et kombinere mærke efterfølges direkte af en anden kombinere mærke, der har en lavere, nul kombinere relativt energiforbrug *Canonical bestilling er defineret med hensyn til anvendelsen af den kanoniske bestilling algoritme til et hele nedbrudte sekvens. Eksempelvis kanoniske nedbrydning af sekvensen <u>ville resultere i sekvensen &lt; U + 0064 latin lille bogstav d, U + 0307 kombinere prik ovenfor, U + 0323 kombinere prik nedenfor &gt;, en sekvens, som er endnu ikke er i rækkefølge, kanonisk. De fleste decompositions til Unicode-strenge er allerede i kanoniske rækkefølge.
Industry:Computer; Software
Et mærke, der bruges til at angive, hvordan en tekst der skal råbte eller sunget.
Industry:Computer; Software