pangu-spacing
pangu-spacing copied to clipboard
support more char
最近整理一些專業課資料,會用到數學公式,遇到希臘字母就不能自動加空格了,當然還有如 %
@
這些符號。
能不能加入對更多西文字符的支持?
可以給我個例子進行測試嗎 ?
你也可以複寫 pangu-spacing-chinese-before-english-regexp
這些變數進行設定
不好意思,剛看到: 我是醫學專業,所以對 ASCII 和正則,學藝不精,是不敢輕易改動的。還是先提提 issue 吧。
可能用到的字符不只是 "a-zA-Z0-9" 這些了。
還有希臘字母:
小寫: α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ ς τ υ φ χ ψ ω
大寫: Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
我還試了幾個德語字母:
ä Ä ö Ö ß ü Ü
還有比如意大利的是 é
還是 è
抑或兩者皆有,我不清楚,沒有試過。
至於其他符號,目前我用到過的,有 @
%
|
=
這些,我看 pangu-spacing 裏面,並沒包括除英文字母和數字外的符號。
具體例子比如「当总体均数λ≥20 时,依据 Poisson 分布近似正态分布的原理,可以对其总体均数进行假设检验。」「小样本资料,如 n≤50,当 p 非常接近 0 或 100%时,可查表直接确定总体概率π的置信区间。」 λ 前面,% 的後面,以及 π 兩側就沒有空格。
RIME 的默認 symbol.yaml 裏面有非常多的符號,全角半角都有,您可以參考一下: https://github.com/rime/brise/blob/master/symbols.yaml
@erstern 目前這相關功能我規劃會在今年 5 月前完成 (希望), 大致上會先參考 pangu.clj 把所需的基本測試補齊。 完成後再麻煩您協助相關測試,謝謝