Unicode: verhon takana

Unicode -konsortio juhli 25 -vuotisjuhliaan viime vuonna. Totuus on, että kaikesta työstä huolimatta, mitä Unicode tekee, jotta voidaan varmistaa teksti kielistä ympäri maailmaa – suurin osa meistä tuntee Unicoden ryhmänä, joka hyväksyy uudet hymiöt.
Mikä ei ehkä ole niin selvää, miksi vaaditaan suuri konsortio tai Unicoden piilotettu monimutkaisuus. Tai kuinka yllä olevassa XCKD -sarjakuvassa esitetyt oksennukset ovat jo ”kelvollisia (mutta ei suositeltuja)”.

Unicoden perustaja ja nykypäivän presidentti Mark Davis on pyrkinyt selventämään, kuinka hymiö sopii Unicodeyn tässä korkean tason yleiskatsauksessa, jossa tarkastellaan mikä Unicode on ja kuinka Unicode-emoji-alakomitea (”Emoji SC”) sopii se.
Davis toteaa, että hymiöt muodostavat vain murto -osan Unicode -standardin merkkien kokonaismäärästä. Voit tuskin tehdä niitä tässä kaaviossa:

Pelkästään hahmot eivät kerro puolta tarinasta. Useiden glyfien on yhdistettävä tietyissä järjestyksissä tai yhdistelmissä näytettäessä.

Yhdistelmä, joka on monille tuttu, on se, kuinka hymiöiden ihoäänet toteutetaan.
Nämä työt havaitsemalla, kun modifioinhahmo näkyy ihmisen emojin jälkeen, kuten 👧 tyttö. Nämä yhdistävät tuetut alustot yhden hymiön näyttämiseksi:

Monimutkaisempi toteutus sisältää kahden tai useamman hymiön yhdistämisen yhdessä niin kutsuttuun emoji ZWJ -jaksoon.
Niitä käytetään luottamaan ammatteja, kuten 👩‍⚖️ Woman -tuomari. Tämä hymiö luodaan 👩 -naista ja ⚖️ Balance Scale -hymiöitä peräkkäin.
”ZWJ” (nollaleveys puuseppä) -hahmo seisoo näiden kahden hymiön välillä, ja se on näkymätön liima, joka yhdistää useita hymiöitä yhdeksi (missä tuetaan).

Muun tyyppiset ZWJ -sekvenssit luetellaan olemassa oleva hymiö, kuten 🕵️ Detective, sukupuolen symbolilla ♀️ sen jälkeen lisätty naarasmerkki.
Tämän tyyppistä ZWJ -sekvenssiä käytetään yleensä, jos hymiö on jo olemassa. Esimerkiksi: juoksija, surffaaja tai monet eleistä.

Ja kyllä, voit yhdistää muokkaimet ja ZWJ: t pidemmän sekvenssin luomiseksi.

Unicode ei hallitse ZWJ -sekvenssejä samalla tavalla kuin uudet hymiöt, jotka vaativat omaa koodipisteensä.
Unicode-suositellut sekvenssit, joita tulisi tukea alustojen välistä konsistenssia. Myyjät voivat kuitenkin vapaasti yhdistää kaikki hymiöt minkä tahansa muun kanssa, kuten he pitävät sopivina.
Microsoftilla on kuusi Ninja -kissaa, jotka ovat saatavana Windowsissa, jotka eivät ole osa Unicode’n suositeltavaa luetteloa. 🐱 Kissan kasvot ja 🚀 -raketti yhdistetään Windows 10: llä, jotta näkyy 🐱‍🚀 astro Cat.
Astro Cat on kelvollinen (kuten se käyttää oikeaa sekvenssirakennetta), mutta sitä ei suositella kuten muut ammatit ja sukupuolet ovat.

XKCD ehdotti, että oksennuksen tulisi olla modifioinhahmo ”oksentavan cowboyn” tekemiseksi.
Davis huomauttaa, että 🤠 cowboy -hattu kasvot voitaisiin jo yhdistää 🤮 Face -oksenteluun voimassa olevan ZWJ -sekvenssin luomiseksi:

Emojille on olemassa muita sekvenssityyppejä, mukaan lukien lippusekvenssit, tag -sekvenssit ja KeyCap -sekvenssit. Sinun tulisi tarkistaa koko diosarja nähdäksesi nämä yksityiskohtaisemmin.
Lopuksi, katsaus (nykyinen, 2017) aikajana uuden hymiöiden syntymiseen:

🚨 Voit lukea lisää tarkistetusta aikataulusta vuodelle 2020 ja sen jälkeen.
Tietenkin Unicodella on vielä paljon tekemistä hymiöiden tuen ulkopuolella:

”Ihmiskieliä on noin 7000, ja niiden elinvoimaa vaihtelevat. Alle 100 näistä kielistä tuetaan hyvin tietokoneilla, matkapuhelimilla ja muilla laitteilla, kun taas kaikki loput riskit ovat digitaalisesti heikommassa asemassa olevia”

Unicode on omaksua merkki -ohjelma. Adoptioista kerätyt varat menevät tutkimukseen näiden digitaalisesti heikommassa asemassa olevien kielten tukemiseksi.
Lisää:

Unicode -hymiö, kirjoittanut Mark Davis
Unicode omaksui hahmon
Uudet hymiöt vuodelle 2017
Hauskat hymiöhakkit

Hae hymiöitä: