book
book copied to clipboard
カタカナ語の末尾長音をつける/つけない基準を決めませんか?
課題
カタカナ語の末尾長音をつけるかつけないかが曖昧だったため、執筆や表記のゆれを統一する際、textlintを設定する際にその都度考える必要があります。
解決策の方針
できるだけ決定論的に決まるようにしたいというのが、このissueの提案です。
提案する基準
基準としては、3つあります。
基準1: 長音を含め4文字以下なら、長音をつける
例: キー, アロー, エラー, カリー, キュー, コピー, フロー, オーバー, カロリー, ゲッター, サーバー, セッター, ナンバー, バリュー, ヘッダー, ベンダー, フッター, ボディー, メンバー, メーラー, ユーザー, ライター, ランナー
基準2: 長音を含め6文字以上なら、長音をつけない
5文字以上になると、末尾長音は違和感が大きくなるため、つけないほうが無難です。「エンジニアー」は変です。また、長音の情報量はほぼゼロなので、無駄は省くほうが文の文字数が節約できて読みやすいと思います。
例: アクセサリ, アクセッサ, アセンブラ, アセンブリ, エンジニア, コンパイラ, デコレータ, パラメータ, プリティア, プログラマ, プロバイダ, プロパティ, リポジトリ, コンピュータ, ジェネレータ, フォーマッタ, ボランティア, インターセプタ, コンストラクタ, トランスパイラ, コントリビュータ
ただし「インタビュー」のような例外があってもいいものとします。
合成語は各単語ごとの判定になります。例えば、「キーバリュー」を1単語扱いするとちょうど6文字で、このルールを適用すると「キーバリュ」になってしまい、これはおかしいからです。
基準3: 長音を含め5文字の場合は、ケースバイケースで自然な方を選ぶ
「エディター」vs「エディタ」だと「エディタ」のほうが多数派ですが、「コミッター」vs「コミッタ」は「コミッター」のほうが多数派です。したがって、長音を含んだとき5文字なる単語は、ケースバイケースでの判定となります。
例: エディタ, バイナリ, バンドラ, レビュア, ウォーター, カレンダー, コミッター, サイドバー, ストーリー, プレビュー, ポピュラー, メタファー, メンテナー, リテラシー
5文字のときだけ決定論的になりませんが、それ以外は決定論的になるので、基準がまったく無いよりマシだと考えます。
基準3の5文字ケースバイケースの場合は、Wikipedia、MDN、Deep Dive、Twitterアンケートのどれかを使って客観的に判断するようにしたら、よりシステマティックに決められるようになるだろうと考えました。
技術用語が一般用語かの観点も関わってくる。「エディター」は「エディタ」でも違和感がないが、「カレンダー」は「カレンダ」になると違和感がある。
この基準は「表記警察」を促すためのものではなく、表記ゆれを吸収したいとなったときに、自律的/システマティックに考えられるガイドとして機能させたい。表記ゆれそのものは文章の価値を変えず、読者も気が付かないことが多いので、警察化すると執筆者のストレスになったりとデメリットのほうが大きいため。
jamashitaさんより
そういえばなんですけど、以前 2文字以下のものであれば末尾の「ー」を省略せず、3文字以上であれば末尾の「ー」を省略するかどうか っていう話し合いがあったと思うのですが、これJIS規格が同じようなこと言及しているみたいですね。
で、肝心なのは続きで、2019年にそのJIS規格が廃止されて、内閣告示に準拠するようになったみたいです。 結論はなにかというと、文字数に関わらず末尾に「ー」をつけることが決まったようです
現在のJIS規格によると文字数による末尾の「ー」の有無は廃止され、つけるようになったようです。 (内閣告示に準拠)
僕もそれ何かで見た覚えがあります😌
最近OSの音声読み上げ機能でドキュメントを読み聞かせてもらうことがあるのですが、話し言葉で伸ばしているなら「ー」をつけたほうが自然に聞こえるので、音声読み上げフレンドリーという観点もあるかもと思っていたところです
LLMに統計的に決めてもらうというのもありかもしれません。
利点
- 学習に基づいている
- 自動的に決められる、議論がいらない
- 例外的な表記についても統計的に正しそうな答えを出せる(engineerはエンジニアーではなくエンジニアなど)
試しに作ってみました: カタカナ表記決めるマン
#721 #77 類題を列挙