dear-habr
dear-habr copied to clipboard
Поддержка тех символов Unicode, код которых более чем шестнадцатиразряден
В настоящее время Хабрахабр, по-видимому, не принимает те символы Unicode, запись двоичного кода которых по длине превосходит шестнадцать разрядов — или принимает в каких-то частных случаях, но его начинает колбасить.
Прежде всего, это поведение Хабрахабра неудобно потому, что оно затрудняет (иногда почти до невозможности, а иногда — просто до состояния «да ну его, нечего и связываться с этой вознёю») всякую публикацию на Хабрахабре блогозаписей и переводов по вопросам, связанным с техническою поддержкою тех идеограмм, которые принято называть японским словом «эмоджи» (или, по системе Поливанова, «эмодзи») и которые в Unicode находятся за пределами области шестнадцатиразрядных кодов символов.
Вот недавний пример: я не видал на Хабрахабре обсуждений той новинки Файерфокса 50, которой ещё 16 ноября посвятил блогозапись «Emoji for all Firefox users!» блоггер Timothy Guan-tin Chien. Хотя эта новость в зарубежной айтишной блогосфере разошлась довольно широко — была в твиттере у Mozilla Hacks, например.
Мешают ли устранению этого недостатка Хабрахабра только технические причины, или же и убеждения также? В правилах у Хабрахабра есть пункт, запрещающий «постоянно использовать смайлики» — возможно, кому-нибудь показалось, что техническая возможность употребления эмоджи будет провоцировать авторов на нарушение этого правила?
Чтобы попробовать поколебать эти убеждения, попробую ткнуть пальцем вот в какое обстоятельство: среди эмоджи есть не только такие идеограммы, которые соответствуют различным выражениям лиц (например, «😀», «😕», «😎») или жестам (например, «🤚», «👍», «👏»), но и многие другие идеограммы — в частности, также и такие, которые означают объекты или символы айтишной действительности (мобильник «📱», клавиатура «⌨», email «📧», компьютер «💻», и так далее). Эти символы могли бы сделаться довольно полезными при оформлении подзаголовков внутри блогозаписей, например.
Пора, пора увеличивать поддержку Unicode.
Это ограничение которое на нас накладывает БД. Сейчас у нас просто нет свободных ресурсов чтобы перегнать все в utf8mb4.
@dotzero год прошёл, может уже пора?
Можно еще по аналогии с GitHub сделать комбинациями символов https://gist.github.com/rxaviers/7360908
dotzero уже не работает у нас, к сожалению ) Сейчас emoji поддерживаются очень экспериментально.
@1Boomburum как попробовать то? Без эмоджи перевод получился не такой эмоциональный: https://habrahabr.ru/post/341518/
Пока особо нечего пробовать - они работают только в черновиках, в постах нет.

@1Boomburum вот мне и казалось что пока редактировал статью эмоджи были, а как опубликовал – пропали :(
Есть ли какие-нибудь новости по вводу Emoji?
@KvanTTT, к сожалению, пока не дошли руки. Главный затык с эмоджи в том, что кодировка нашей базы их не поддерживает — надо ее всю переконвертировать. А база большая, и мы опасаемся делать эту задачу по остаточному принципу фоном, чтобы случайно чего не накуралесить.
Надеюсь, дело сдвинется где-то к зиме, когда мы закончим более важные задачи. Но кроме эмодзи в списке дел по наведению порядка есть еще и другие задачи, поэтому пока не могу сказать чего-то конкретного.
@daler-als а нельзя сделать как у гитхаба? https://gist.github.com/rxaviers/7360908
И только при отображении статьи в режиме просмотра, подгружать эмоджи все поверх ASCII-комбинаций.
@k06a, спасибо за наводку!
Сравнение habr с другими ресурсами:
Хабр | Другие сайты |
---|---|
Поддержка Emoji ❌ | Поддержка Emoji ✅ |
@daler-als может уже пора?
@zhovner, да конечно, пора :−)
Мы, в итоге, остановились на варианте с конвертацией базы, а не использования ASCII-комбинаций, потому что нам ее все равно нужно конвертировать для других целей.
Приступим к этой задачи только после запуска и отладки английской версии.
А когда уже выйдет английская версия наконец? :smile:
Уже вот-вот.
Коллеги :baggage_claim:, добрый :heart: вечер :night_with_stars:, есть :fork_and_knife: ли :straight_ruler: какие-нибудь :no_good_woman: :woman_cartwheeling: новости :newspaper:? Спасибо!
Из-за этого ограничения трудно писать чисто технические посты, посвящённые разным аспектам Юникода. В них очень часто используются примеры строк и фрагменты кода с этими знаками.
Меня лично раздражают эмодзи и прочая весёлая детсадовская смайлота в технических текстах. Лучше б и не добавляли никогда
объекты или символы айтишной действительности (мобильник «:iphone:», клавиатура «:keyboard:», email «:email:», компьютер «:computer:», и так далее)
А зачем вам иероглифы вместо слов? Да еще которые хрен разглядишь