dear-habr icon indicating copy to clipboard operation
dear-habr copied to clipboard

Поддержка тех символов Unicode, код которых более чем шестнадцатиразряден

Open Mithgol opened this issue 8 years ago • 19 comments

В настоящее время Хабрахабр, по-видимому, не принимает те символы Unicode, запись двоичного кода которых по длине превосходит шестнадцать разрядов — или принимает в каких-то частных случаях, но его начинает колбасить.

Прежде всего, это поведение Хабрахабра неудобно потому, что оно затрудняет (иногда почти до невозможности, а иногда — просто до состояния «да ну его, нечего и связываться с этой вознёю») всякую публикацию на Хабрахабре блогозаписей и переводов по вопросам, связанным с техническою поддержкою тех идеограмм, которые принято называть японским словом «эмоджи» (или, по системе Поливанова, «эмодзи») и которые в Unicode находятся за пределами области шестнадцатиразрядных кодов символов.

Вот недавний пример: я не видал на Хабрахабре обсуждений той новинки Файерфокса 50, которой ещё 16 ноября посвятил блогозапись «Emoji for all Firefox users!» блоггер Timothy Guan-tin Chien. Хотя эта новость в зарубежной айтишной блогосфере разошлась довольно широко — была в твиттере у Mozilla Hacks, например.

Мешают ли устранению этого недостатка Хабрахабра только технические причины, или же и убеждения также? В правилах у Хабрахабра есть пункт, запрещающий «постоянно использовать смайлики» — возможно, кому-нибудь показалось, что техническая возможность употребления эмоджи будет провоцировать авторов на нарушение этого правила?

Чтобы попробовать поколебать эти убеждения, попробую ткнуть пальцем вот в какое обстоятельство: среди эмоджи есть не только такие идеограммы, которые соответствуют различным выражениям лиц (например, «😀», «😕», «😎») или жестам (например, «🤚», «👍», «👏»), но и многие другие идеограммы — в частности, также и такие, которые означают объекты или символы айтишной действительности (мобильник «📱», клавиатура «⌨», email «📧», компьютер «💻», и так далее). Эти символы могли бы сделаться довольно полезными при оформлении подзаголовков внутри блогозаписей, например.

Пора, пора увеличивать поддержку Unicode.

Mithgol avatar Nov 20 '16 09:11 Mithgol

Это ограничение которое на нас накладывает БД. Сейчас у нас просто нет свободных ресурсов чтобы перегнать все в utf8mb4.

dotzero avatar Nov 20 '16 19:11 dotzero

@dotzero год прошёл, может уже пора?

k06a avatar Nov 02 '17 09:11 k06a

Можно еще по аналогии с GitHub сделать комбинациями символов https://gist.github.com/rxaviers/7360908

k06a avatar Nov 02 '17 09:11 k06a

dotzero уже не работает у нас, к сожалению ) Сейчас emoji поддерживаются очень экспериментально.

1Boomburum avatar Nov 02 '17 09:11 1Boomburum

@1Boomburum как попробовать то? Без эмоджи перевод получился не такой эмоциональный: https://habrahabr.ru/post/341518/

k06a avatar Nov 02 '17 09:11 k06a

Пока особо нечего пробовать - они работают только в черновиках, в постах нет.

1Boomburum avatar Nov 02 '17 11:11 1Boomburum

@1Boomburum вот мне и казалось что пока редактировал статью эмоджи были, а как опубликовал – пропали :(

k06a avatar Nov 02 '17 13:11 k06a

Есть ли какие-нибудь новости по вводу Emoji?

KvanTTT avatar Aug 25 '18 13:08 KvanTTT

@KvanTTT, к сожалению, пока не дошли руки. Главный затык с эмоджи в том, что кодировка нашей базы их не поддерживает — надо ее всю переконвертировать. А база большая, и мы опасаемся делать эту задачу по остаточному принципу фоном, чтобы случайно чего не накуралесить.

Надеюсь, дело сдвинется где-то к зиме, когда мы закончим более важные задачи. Но кроме эмодзи в списке дел по наведению порядка есть еще и другие задачи, поэтому пока не могу сказать чего-то конкретного.

daler-als avatar Aug 27 '18 10:08 daler-als

@daler-als а нельзя сделать как у гитхаба? https://gist.github.com/rxaviers/7360908

И только при отображении статьи в режиме просмотра, подгружать эмоджи все поверх ASCII-комбинаций.

k06a avatar Aug 27 '18 10:08 k06a

@k06a, спасибо за наводку!

daler-als avatar Aug 27 '18 10:08 daler-als

Сравнение habr с другими ресурсами:

Хабр Другие сайты
Поддержка Emoji ❌ Поддержка Emoji ✅

@daler-als может уже пора?

zhovner avatar Jan 04 '19 17:01 zhovner

@zhovner, да конечно, пора :−)

Мы, в итоге, остановились на варианте с конвертацией базы, а не использования ASCII-комбинаций, потому что нам ее все равно нужно конвертировать для других целей.

Приступим к этой задачи только после запуска и отладки английской версии.

daler-als avatar Jan 09 '19 10:01 daler-als

А когда уже выйдет английская версия наконец? :smile:

KvanTTT avatar Jan 09 '19 11:01 KvanTTT

Уже вот-вот.

daler-als avatar Jan 09 '19 11:01 daler-als

Коллеги :baggage_claim:, добрый :heart: вечер :night_with_stars:, есть :fork_and_knife: ли :straight_ruler: какие-нибудь :no_good_woman: :woman_cartwheeling: новости :newspaper:? Спасибо!

alexeyev avatar Mar 09 '20 21:03 alexeyev

Из-за этого ограничения трудно писать чисто технические посты, посвящённые разным аспектам Юникода. В них очень часто используются примеры строк и фрагменты кода с этими знаками.

vsemozhetbyt avatar Sep 13 '20 09:09 vsemozhetbyt

Меня лично раздражают эмодзи и прочая весёлая детсадовская смайлота в технических текстах. Лучше б и не добавляли никогда

Eireen avatar Aug 01 '22 15:08 Eireen

объекты или символы айтишной действительности (мобильник «:iphone:», клавиатура «:keyboard:», email «:email:», компьютер «:computer:», и так далее)

А зачем вам иероглифы вместо слов? Да еще которые хрен разглядишь

Eireen avatar Aug 01 '22 15:08 Eireen