トップページへ 
 当該のページは、 0010008番目 (2011/07/17~) 更新日(2011/07/19) 『 kiho-P032
 全体のページは、 1920794番目 (1997/04/01~)


サンスクリット語の一部の特殊な文字コード (utf-8)

ホームページに、ローマナイズドされた「サンスクリット語」を表示するにはいろいろな方法があります。文字の入力の方法も難しいですがいろいろあります。

たとえば、「KH方法」、「TH方法」、「LaTeX2e」方法などです。それぞれ一長一短があります。

ここでは、文字化けを避けるために、全ページを、国際標準のひとつ、utf-8 コードに統一していますので、この場合の、非常に単純な、表示方法および入力方法の一つをご紹介します。

HTML文(HTML4.0、XML1.0)では、1文字単位の特殊文字は、一般文字の間に、&#x と ; とで括(くく)られた間に、十六進表示の4桁の数値を挿入して、HTML文法用語で言う、「数値文字参照」 を実現します。

日本語主体で作られていて、日本では多くの方が利用されている、ホームページ作成用のソフトのひとつである、日本IBM社製のIBMホームページビルダー(テストではVer13.0)では、サンスクリット語の特殊文字が、「プレビュー」や、「HTMLソース」や、「ページ編集」では正確に表示されない(黒点表示、文字化け、バグ、ソフトウェア障害?)場合があります。(「プレビュー」では表示されている場合が多いです)。しかし、ほぼ最新版のブラウザ(IE8.0とか、Google Chromeなど)では、ちゃんと表示できています。海外主体のDreamWeaverなどは多国語対応が進んでいるような気がしています。

サンスクリット語を表示できるフォントはいくつかありますが、「utf-8」 文字コードで、できるだけ見やすい文字を試みようとしても、各「ブラウザ」(IE8.0、Firefox、GoogleChrome、Safari、Opera、このほか、Macなど、およびそれらのバージョンごと)によっても、 また、フォントのサイズの指定によっても、見え方が異なり、多国語文字が混在するホームページにとっては、フォントの問題は、非常に悩ましい問題であり、たえず、試行錯誤している状況です。

ブラウザで下記サンスクリット語の文字を見るとき、サイズを、「中」よりも大きい「大」などのサイズでご覧くださいませ。ただ、本文中に下記文字が混在して表出するときはホームページで使用中のフォントと同じままでいいかと思います。


     小文字         大文字

01)  ā = ā   Ā = Ā

02)  ī = ī   Ī = Ī

03)  ū = ū  Ū = Ū

04)  ṛ = ṛ  Ṛ = Ṛ

05)  ṝ = ṝ  Ṝ = Ṝ

06)  ṅ = ṅ  Ṅ = Ṅ

07)  ñ = ñ  

08)  ṭ = ṭ  Ṭ = Ṭ

09)  ḍ = ḍ  Ḍ = Ḍ

10)  ṇ = ṇ  Ṇ = Ṇ

11)  ś = ś  Ś = Ś

12)  ṣ = ṣ  Ṣ = Ṣ

13)  ḥ = ḥ   Ḥ = Ḥ

14)  ṃ = ṃ   Ṃ = Ṃ

15)  ḷ = ḷ   Ḷ = Ḷ

 一例)  nirvāṇa  = nirvāṅa

上記の各々の特殊文字30個をご自身が覚えやすいように単語登録しておけば、少しは楽でいいかと思います。

上記文字コードで大体間に合うと思われますが、残りの、r と l の字の下の、白抜き○、が付いた特殊の文字コードが、utf-8 で探しきれないので、現在下記 utf-8 コード表の中から調査中です。


 出拠:文字コードの出拠は、下記のURLです。このURLの厖大な量のコード表のなかの、
   1)Basic Latin、 (U+0000....U+007F)
   2)Latin Extended- A、 (U+0100....U+017F)
   3)Latin Extended Additional、(U+1E00....U+1EFF)
から、該当の文字コードを参照します。


http://www.utf8-chartable.de/unicode-utf8-table.pl

  下図は、一例です。



今日も、一日、ありがとうございます。

ゆったりした気分でご覧下さい






***************



                                                    以上

 よろしければ、ご感想、メールなど  トップページに戻る