В течение последних нескольких недель
Nikita Prokopov внедрял поддержку эмодзи для
Skija. Он решил поделиться несколькими мелкими деталями того, как это «самое большое новшество в человеческом общении со времен изобретения буквы

» работает под капотом.
Примечание переводчика: Хабр не поддерживает эмодзи, поэтому пришлось выкручиваться и заменить эмодзи картинками.
Unicode
Каждый символ на компьютере кодируется числом. Самая популярная кодировка — Unicode, а две самые распространенные подвариации — UTF-8 и UTF-16.
Unicode выделяет 2
21 (2 млн) символов, назывемых «codepoints». Из этих двух миллионов сейчас определены только ~150k символов. В эти 150 000 символов впихнули все языки, мёртвые и живые и прочие украшательства. Можно использовать различные шрифты, писать задом наперед и кверх ногами:

, а так же отобразить «GHz» как один глиф:

.
Направленная вправо двуглавая стрела с оперением и двумя вертикальными штрихами:

или семиглазый монстр:

. И утка:
Читать дальше →Читать полностью
Comments
Show all comments