1. Qitailang's HP
  2. Esperanto

エスペラント・メモ -- 字上符号付き文字と代替表記について

エスペラントには Ĉ ĉ, Ĝ ĝ, Ĥ ĥ, Ĵ ĵ, Ŝ ŝ, Ŭ ŭ の大文字・小文字併せて12個の字上符号付きの文字がある。字上符号は ^ サーカムフレックス(cirkumflekso)、 ˘ ブレーヴェ(hoketo)、総称してダイアクリティカルマーク(diakritaj signoj)と呼ばれる。

ザメンホフがエスペラントを発表した当時、これらの文字を所有していない印刷所もあったため、Fundamento de Esperanto に下のような代替表記法の規定を設けた。

ĉ, ĝ, ĥ, ĵ, ŝ, ŭ の活字を持たない印刷所はそれらに代えて ch, gh, hh, jh, sh, u を使用することができる。

今となっては、パソコンにこれらの文字を入力したり、Webページで文字化けすることなく表示することができるようになったが、今だに使われている現状があるようである。少なくともエスペラントの普及を標榜している学習ページなどで、教材を代替表記で表示するのは止めてほしい。読みにくいし頭に入って来ない。

しかしメールでは絶対に文字化けしない方法は未だないように思われるので、全くなくしてしまうのも時期尚早かもしれない。

ところで代替表記法は、ザメンホフが規定した方法(h 方式)以外の表記法を使っている人もいる。その方法とは下のようなものである。

字上符号文字後置方式 c^, g^, h^, j^, s^, u^ (u~)
字上符号文字前置方式 ^c, ^g, ^h, ^j, ^s, ^u (~u)
x 後置方式 cx, gx, hx, jx, sx, ux
変則 h 方式 ch, gh, hh, jh, sh, w

このページでは、字上符号付き文字をパソコンで入力する方法とWebページで正しく表示する方法を、私が使っている方法を中心に書いてみる。私は、パソコンは Mac OS-X 10.6 と Windows7 で、ブラウザは正しく書かれた HTML では字上符号付き文字を文字化けせずに閲覧することができる。

パソコンでの入力

最近では、OS自体がユニコードになっているので、基本的に符号付き文字を扱えるはずである。ただどのキーを叩いてその文字を入力するのかということがあって、これを定義するファイルをインストールする必要がある場合もある。キーボード・レイアウト・リソースと呼ばれるものである。

Windows での入力

Vastalto さんが作成・公開されている EspSpain というキーボード・レイアウトを使わせてもらっている。Windows10 まで対応したバージョンが揃っているので(Windows7用がWindows10 64ビット版で動作報告あり)、自分にあったバージョンの物を入手させてもらえばよいであろう。書庫ファイルを展開すると、説明書(Legumin.txt, EspSpain.txt)があるので、そこに書いてある指示に従えば簡単にインストールできる。

入力は入力モードを「ES スペイン語(インターナショナルソート)」にして、たとえば、^ を叩いた後 s を叩くと sx の文字が入力できる。注意することとしては、ワープロやエディタなどを必要に応じてユニコード編集モードにセットすることと、同じくユニコードで保存することである。

Windows7 以降は別途キーボード・レイアウトをインスールするまでもなく、入力言語を[フランス語(カナダマルチリンガル)]にするだけで入力できるようです。しかし、キー・コンビネーションが面倒くさそうです。コチラに詳しい説明があります

他にも "esperanto keyboard layout" で検索するとリソースを見つけることができるかもしれない。

Mac での入力

Mac では標準でキーボード・レイアウト・リソースはインストール済みなので、システム環境設定の「言語とテキスト」の「入力ソース」で U.S.Extendedを選べばよい。option + 6 を叩いた後 s を叩くと sx の文字が入力できる。option + b を叩いた後 u を叩けば ux が入力できる。

-->コチラで使い勝手の良いリソースが配布されているので使ってみるのもよいかもしれない。option + s で ŝ 、option + u で ŭ を打ち込むことができる。私は今これを使わせてもらっている(Esperanto-RH Keyboard Layout)。

↑リンク切れになってしまったようです。ダウンロードしておいたので入手したい方はメールでご連絡ください。(トップページの最下行にメール用リンク "Kontakti Min" があります。)

文字化けしない Webページ の書き方

基本的なこと

(1) Webページ はHTMLの文法で書くが、metaタグにキッチリ文字コードを書いて指定しておくことと、ちゃんとその文字コードで保存することが大事である。例えば、

HTML1, HTML4,XHTML4では、

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

HTML5では、上の記述でもよいが、charset属性を使用すれば、

<meta charset="UTF-8">

のように短くすることができる。とにかく HTML に文字コードの宣言をしておくことは非常に重要なことで、字上符号付き文字に限らず、これがきちんと書かれていないと日本語のページなどでも文字化けを起こして、閲覧者をイライラさせることになる。

(2) 文字コードを UTF-8 にすると、字上符号付き文字をそのまま使ってHTMLを書いて問題ない。Shif_JIS や EUC-JP の場合は数値参照表現という形式で記述しなければならない。(例:tiu cxi pagxo → tiu &#265;i pa&#285;o)

  Ĉ ĉ Ĝ ĝ Ĥ ĥ Ĵ ĵ Ŝ ŝ Ŭ û
10進法 &#264; &#265; &#284; &#285; &#292; &#293; &#308; &#309; &#348; &#349; &#364; &#365;
16進法; &#x108; &#x109; &#x11c; &#x11d; &#x125; &#x126; &#x134; &#x135; &#x15c; &#x15d; &#x16c; &#x16d;
変換ツールなど

これは自作したのだが、代替表記で書かれたHTMLソースでもブラウザが自動で字上符号付き文字に変換して表示するツール、テキストの随時変換ツール、代替表記で書かれたHTMLを一括して字上符号付き文字または数値参照表現に変換するツール、フォームに字上符号付き文字への変換機能を追加するツール(このページのコメントフォームのようなもの)などを使うと省力で文字化けしないページを作成できるので、気が向いたら使ってみていただきたい。

エスペラント字上符号付き文字関連ツール

なお、ザメンホフ方式(h方式)では u が u か ux かプログラム的には判断できないので ux は w で書く変則 h 方式にしないとうまく変換できない。


  1. このページに関するご感想・ご質問などをお書き下さい。
  2. タグは使用できません。
  3. パスワードを設定しておくとご自信の投稿を削除できます。
  4. 当サイトにふさわしくないと判断した投稿は管理者がことわりなく削除することがあります。
お名前
パスワード 英数字8文字以内
件名
C^U~ ^C~U CxUx Ch,w Ignori