シンハラ文字 (Unicodeのブロック)

Unicodeのブロック

シンハラ文字(シンハラもじ、英語: Sinhala)は、Unicodeの32個目のブロック

シンハラ文字 (Unicodeのブロック)
Sinhala
範囲 U+0D80..U+0DFF
(128 個の符号位置)
基本多言語面
用字 シンハラ文字
主な言語・文字体系
割当済 90 個の符号位置
未使用 38 個の保留
Unicodeのバージョン履歴
3.0 79 (+79)
7.0 89 (+10)
13.0 90 (+1)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

解説

編集

インド洋に浮かぶ島国スリランカの公用語である、インド・ヨーロッパ語族インド・アーリア語派シンハラ語の表記に用いられるシンハラ文字を収録している。

シンハラ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるアル・ラクナ(al-lakuna)という記号を子音字の右上に付加したりする。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。通常のブラーフミー系文字にあるこれらの区別に加えて、シンハラ文字には前鼻音化した有声破裂音にも独立した文字が割り当てられているため、各調音点における破裂音には計5種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っているが、インドの文字体系ではないため他のブラーフミー系文字と符号化の順序に互換性は無い。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(シンハラ数字)を有しているが、シンハラ文字においては占星術の記述に古典的に使用されたのみで、現在の通常の文章ではあまり用いられない。

Unicodeが登場する以前のシンハラ文字の文字コード規格であるSLS 1134やISO/IEC 10646-1:1993[1]などに由来する文字セットを元に、いくつかのUnicode Consortium宛の提案文書由来の拡張文字が加えられている。Unicodeのバージョン3.0で初めて追加された。

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0D81 SINHALA SIGN CANDRABINDU アヌナーシカ、或いはチャンドラビンドゥ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

サンスクリット語で用いられる。[2]

U+0D82 SINHALA SIGN ANUSVARAYA アヌスヴァーラ、或いはビンドゥ。

直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。

U+0D83 SINHALA SIGN VISARGAYA ヴィサルガ

音節末に[h]を伴うことを表す。

独立母音字
U+0D85 SINHALA LETTER AYANNA 短母音[a]を表す。 a
U+0D86 SINHALA LETTER AAYANNA 長母音[aː]を表す。 ā
U+0D87 SINHALA LETTER AEYANNA 短母音[æ]を表す。 æ
U+0D88 SINHALA LETTER AEEYANNA 長母音[æː]を表す。 ǣ
U+0D89 SINHALA LETTER IYANNA 短母音[i]を表す。 i
U+0D8A SINHALA LETTER IIYANNA 長母音[iː]を表す。 ī
U+0D8B SINHALA LETTER UYANNA 短母音[u]を表す。 u
U+0D8C SINHALA LETTER UUYANNA 長母音[uː]を表す。 ū
U+0D8D SINHALA LETTER IRUYANNA 音節主音化した短母音としてのR(IPA:[r̩])を表す。 [3]
U+0D8E SINHALA LETTER IRUUYANNA 音節主音化した長母音としてのR(IPA:[r̩ː])を表す。 r̥̄[4]
U+0D8F SINHALA LETTER ILUYANNA 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [5]
U+0D90 SINHALA LETTER ILUUYANNA 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[6]
U+0D91 SINHALA LETTER EYANNA 短母音[e]を表す。 e
U+0D92 SINHALA LETTER EEYANNA 長母音[eː]を表す。 ē
U+0D93 SINHALA LETTER AIYANNA 二重母音[aɪ]を表す。 ai
U+0D94 SINHALA LETTER OYANNA 短母音[o]を表す。 o
U+0D95 SINHALA LETTER OOYANNA 長母音[oː]を表す。 ō
U+0D96 SINHALA LETTER AUYANNA 二重母音[aʊ]を表す。 au
子音字
U+0D9A SINHALA LETTER ALPAPRAANA KAYANNA 子音[k]を表す。 k
U+0D9B SINHALA LETTER MAHAAPRAANA KAYANNA 子音[kʰ]を表す。 kh
U+0D9C SINHALA LETTER ALPAPRAANA GAYANNA 子音[ɡ]を表す。 g
U+0D9D SINHALA LETTER MAHAAPRAANA GAYANNA 子音[ɡʱ]を表す。 gh
U+0D9E SINHALA LETTER KANTAJA NAASIKYAYA 子音[ŋ]を表す。
U+0D9F SINHALA LETTER SANYAKA GAYANNA 前鼻音化した子音[ᵑɡ]を表す。 n̆g
U+0DA0 SINHALA LETTER ALPAPRAANA CAYANNA 子音[c]を表す。 c
U+0DA1 SINHALA LETTER MAHAAPRAANA CAYANNA 子音[cʰ]を表す。 ch
U+0DA2 SINHALA LETTER ALPAPRAANA JAYANNA 子音[ɟ]を表す。 j
U+0DA3 SINHALA LETTER MAHAAPRAANA JAYANNA 子音[ɟʱ]を表す。 jh
U+0DA4 SINHALA LETTER TAALUJA NAASIKYAYA 子音[ɲ]を表す。 ñ
U+0DA5 SINHALA LETTER TAALUJA SANYOOGA NAAKSIKYAYA 子音列[ɟɲ]を表す。
U+0DA6 SINHALA LETTER SANYAKA JAYANNA 前鼻音化した子音[ⁿɟ]を表す。 n̆j
U+0DA7 SINHALA LETTER ALPAPRAANA TTAYANNA 子音[ʈ]を表す。
U+0DA8 SINHALA LETTER MAHAAPRAANA TTAYANNA 子音[ʈʰ]を表す。 ṭh
U+0DA9 SINHALA LETTER ALPAPRAANA DDAYANNA 子音[ɖ]を表す。
U+0DAA SINHALA LETTER MAHAAPRAANA DDAYANNA 子音[ɖʱ]を表す。 ḍh
U+0DAB SINHALA LETTER MUURDHAJA NAYANNA 子音[ɳ]を表す。
U+0DAC SINHALA LETTER SANYAKA DDAYANNA 前鼻音化した子音[ᶯɖ]を表す。 n̆ḍ
U+0DAD SINHALA LETTER ALPAPRAANA TAYANNA 子音[t]を表す。 t
U+0DAE SINHALA LETTER MAHAAPRAANA TAYANNA 子音[tʰ]を表す。 th
U+0DAF SINHALA LETTER ALPAPRAANA DAYANNA 子音[d]を表す。 d
U+0DB0 SINHALA LETTER MAHAAPRAANA DAYANNA 子音[dʱ]を表す。 dh
U+0DB1 SINHALA LETTER DANTAJA NAYANNA 子音[n]を表す。 n
U+0DB2 (予約済)
U+0DB3 SINHALA LETTER SANYAKA DAYANNA 前鼻音化した子音[ᶯd]を表す。 n̆d
U+0DB4 SINHALA LETTER ALPAPRAANA PAYANNA 子音[p]を表す。 p
U+0DB5 SINHALA LETTER MAHAAPRAANA PAYANNA 子音[pʰ]を表す。 ph
U+0DB6 SINHALA LETTER ALPAPRAANA BAYANNA 子音[b]を表す。 b
U+0DB7 SINHALA LETTER MAHAAPRAANA BAYANNA 子音[bʱ]を表す。 bh
U+0DB8 SINHALA LETTER MAYANNA 子音[m]を表す。 m
U+0DB9 SINHALA LETTER AMBA BAYANNA 前鼻音化した子音[ᵐb]を表す。 m̆b
U+0DBA SINHALA LETTER YAYANNA 子音[j]を表す。 y
U+0DBB SINHALA LETTER RAYANNA 子音[r]を表す。 r
U+0DBC (予約済)
U+0DBD SINHALA LETTER DANTAJA LAYANNA 子音[l]を表す。 l
U+0DBE (予約済)
U+0DBF (予約済)
U+0DC0 SINHALA LETTER VAYANNA 子音[ʋ]を表す。 v
U+0DC1 SINHALA LETTER TAALUJA SAYANNA 子音[ɕ]を表す。 ś
U+0DC2 SINHALA LETTER MUURDHAJA SAYANNA 子音[ʂ]を表す。
U+0DC3 SINHALA LETTER DANTAJA SAYANNA 子音[s]を表す。 s
U+0DC4 SINHALA LETTER HAYANNA 子音[h]を表す。 h
U+0DC5 SINHALA LETTER MUURDHAJA LAYANNA 子音[ɭ]を表す。
U+0DC6 SINHALA LETTER FAYANNA 子音[f]を表す。 f
記号
U+0DCA SINHALA SIGN AL-LAKUNA アル・ラクナ(al-lakuna)[2]、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にアル・ラクナ記号が子音字の上に書かれることもある。

従属母音記号
U+0DCF SINHALA VOWEL SIGN AELA-PILLA 長母音[aː]を表す。 ā
U+0DD0 SINHALA VOWEL SIGN KETTI AEDA-PILLA 短母音[æ]を表す。 æ
U+0DD1 SINHALA VOWEL SIGN DIGA AEDA-PILLA 長母音[æː]を表す。 ǣ
U+0DD2 SINHALA VOWEL SIGN KETTI IS-PILLA 短母音[i]を表す。 i
U+0DD3 SINHALA VOWEL SIGN DIGA IS-PILLA 長母音[iː]を表す。 ī
U+0DD4 SINHALA VOWEL SIGN KETTI PAA-PILLA 短母音[u]を表す。 u
U+0DD5 (予約済)
U+0DD6 SINHALA VOWEL SIGN DIGA PAA-PILLA 長母音[uː]を表す。 ū
U+0DD7 (予約済)
U+0DD8 SINHALA VOWEL SIGN GAETTA-PILLA 音節主音化した短母音としてのR(IPA:[r̩])を表す。 [3]
U+0DD9 SINHALA VOWEL SIGN KOMBUVA 短母音[e]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

e
U+0DDA SINHALA VOWEL SIGN DIGA KOMBUVA 長母音[eː]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

ē
U+0DDB SINHALA VOWEL SIGN KOMBU DEKA 二重母音[aɪ]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

ai
2要素からなる従属母音記号
U+0DDC SINHALA VOWEL SIGN KOMBUVA HAA AELA-PILLA 短母音[o]を表す。 o
U+0DDD SINHALA VOWEL SIGN KOMBUVA HAA DIGA AELA-PILLA 長母音[oː]を表す。 ō
U+0DDE SINHALA VOWEL SIGN KOMBUVA HAA GAYANUKITTA 二重母音[aʊ]を表す。 au
従属母音記号
U+0DDF SINHALA VOWEL SIGN GAYANUKITTA 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [5]
占星術用数字
U+0DE6 SINHALA LITH DIGIT ZERO シンハラ文字における数字の0

占星術の記述にかつて用いられた。

0
U+0DE7 SINHALA LITH DIGIT ONE シンハラ文字における数字の1

占星術の記述にかつて用いられた。

1
U+0DE8 SINHALA LITH DIGIT TWO シンハラ文字における数字の2

占星術の記述にかつて用いられた。

2
U+0DE9 SINHALA LITH DIGIT THREE シンハラ文字における数字の3

占星術の記述にかつて用いられた。

3
U+0DEA SINHALA LITH DIGIT FOUR シンハラ文字における数字の4

占星術の記述にかつて用いられた。

4
U+0DEB SINHALA LITH DIGIT FIVE シンハラ文字における数字の5

占星術の記述にかつて用いられた。

5
U+0DEC SINHALA LITH DIGIT SIX シンハラ文字における数字の6

占星術の記述にかつて用いられた。

6
U+0DED SINHALA LITH DIGIT SEVEN シンハラ文字における数字の7

占星術の記述にかつて用いられた。

7
U+0DEE SINHALA LITH DIGIT EIGHT シンハラ文字における数字の8

占星術の記述にかつて用いられた。

8
U+0DEF SINHALA LITH DIGIT NINE シンハラ文字における数字の9

占星術の記述にかつて用いられた。

9
追加の従属母音記号
U+0DF2 SINHALA VOWEL SIGN DIGA GAETTA-PILLA 音節主音化した長母音としてのR(IPA:[r̩ː])を表す。 r̥̄[4]
U+0DF3 SINHALA VOWEL SIGN DIGA GAYANUKITTA 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[6]
約物
U+0DF4 SINHALA PUNCTUATION KUNDDALIYA テキストの終端を表す。

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「記号」(Sign)、「従属母音記号」(Dependent vowel signs)、「2要素からなる母音記号」(Two-part dependent vowel signs)、「占星術用数字」(Astrological digits)、「追加の従属母音記号」(Additional dependent vowel signs)、「約物」(Punctuation)の9個となっている[2]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはシンハラ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはシンハラ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはシンハラ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

記号(Sign

編集

この小分類にはシンハラ文字のうち、アル・ラクナ(al-lakuna)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。

従属母音記号(Dependent vowel signs

編集

この小分類にはシンハラ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。

2要素からなる母音記号(Two-part dependent vowel signs

編集

これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]

占星術用数字(Astrological digits

編集

これらの数字は、シンハラ・リス・イラカム(Sinhala Lith Illakkam)とも呼ばれ、主に占星術の記述に用いられた。この数字体系には、111E1-111F4 の範囲でエンコードされているシンハラ語の古典的な数字、シンハラ・イラカム(Sinhala Illakkam)とは異なり、0のプレースホルダーの概念がある。[2]

追加の従属母音記号(Additional dependent vowel signs

編集

この小分類にはシンハラ文字のうち、サンスクリット語に由来する音節主音化した長母音としての流音の母音記号が2つ収録されている。

約物(Punctuation

編集

この小分類にはシンハラ文字のうち、テキストの終端を表す約物(句読点)1文字のみが収録されている。

文字コード

編集
シンハラ文字(Sinhala)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0D8x
U+0D9x
U+0DAx
U+0DBx
U+0DCx
U+0DDx
U+0DEx
U+0DFx
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
3.0 79 L2/04-131 Gihan Dias (15 April 2004), Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737) (英語)
7.0 U+0DE6-0DEF 10 L2/07-002 Michael Everson (12 January 2007), Proposal to add archaic numbers for Sinhala to the BMP (WG2 N3195) revised (英語)
L2/08-007 ICT / Sri Lanka (7 January 2008), Inclusion of archaic Sinhala numerals in the Sinhala character code range (英語)
L2/08-068 Gihan Dias (28 January 2008), Archaic Sinhala Numerals (英語)
L2/10-165 Gihan Dias (5 May 2010), Preliminary Proposal to Encode Sinhala Digits and Numerals (英語)
L2/08-105 Sri Lanka N.B. (5 February 2008), Observations on the Encoding of Archaic Sinhala Numerals in Unicode/UCS (英語)
L2/10-301 Ireland NB (9 August 2010), Proposal to add archaic numbers for Sinhala to the BMP and SMP (WG2 N3876) (英語)
L2/10-312 Gihan Dias (10 August 2010), Proposal to Encode Sinhala Archaic Numerals and Numbers (英語)
L2/10-337 SLSI (14 September 2010), Proposal to include Sinhala Numerals to the BMP and SMP (WG2 N3888) (英語)
L2/10-433 Harsha Wijayawardhana; Information and Communication Agency of Sri Lanka; SLSI (26 October 2010), Background information on the use of Sinhala Numerals (英語)
13.0 U+0D81 1 L2/18-060 Srinidhi A; Sridatta A (5 February 2018), Proposal to encode the CANDRABINDU for Sinhala (英語)
L2/18-079 Deborah Anderson (21 March 2018), Feedback on Sinhala candrabindu (L2/18-060) (英語)
L2/20-137 Gihan Dias (4 May 2020), Encoding of a character "Sinhala Chandrabindu" (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ Gihan Dias (2004年4月15日). “Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737)” (英語). Unicode. 2024年8月8日閲覧。
  2. ^ a b c d e "The Unicode Standard, Version 15.1 - U0D80.pdf" (PDF). The Unicode Standard (英語). 2024年8月8日閲覧
  3. ^ a b IASTではṛと表記される。
  4. ^ a b IASTではṝと表記される。
  5. ^ a b IASTではḷと表記される。
  6. ^ a b IASTではḹと表記される。

関連項目

編集