グルムキー文字 (Unicodeのブロック)

グルムキー文字(グルムキーもじ、英語: Gurmukhi)は、Unicodeの25個目のブロック

グルムキー文字 (Unicodeのブロック)
Gurmukhi
範囲 U+0A00..U+0A7F
(128 個の符号位置)
基本多言語面
用字 グルムキー文字
主な言語・文字体系
割当済 80 個の符号位置
未使用 48 個の保留
Unicodeのバージョン履歴
1.0.0 74 (+74)
1.1 75 (+1)
4.0 77 (+2)
5.1 79 (+2)
11.0 80 (+1)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

解説

編集

インド西部のパンジャーブ州などで主にシーク教徒に話されているパンジャーブ語を表記するグルムキー文字を収録している。

グルムキー文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるhalantという記号を子音字の下に付加したりする。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送る。単語毎に分かち書きをし、デーヴァナーガリーやベンガル文字などと同様に同じ単語内ではシローレーカー(śirorekhā)と呼ばれる上部の水平線を繋げて書かれる。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(グルムキー数字)を有している。

Unicodeのバージョン1.0においても「グルムキー文字(Gurmukhi)」というブロック名で制定されていた。[1]

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0A01 GURMUKHI SIGN ADAK BINDI addhak bindī。デーヴァナーガリーにおけるアヌナーシカに相当する。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+0A02 GURMUKHI SIGN BINDI bindī。デーヴァナーガリーにおけるアヌスヴァーラに相当する。

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+0A03 GURMUKHI SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

独立母音字
U+0A05 GURMUKHI LETTER A 短母音[ə]を表す。 a
U+0A06 GURMUKHI LETTER AA 長母音[ɑː]を表す。 ā
U+0A07 GURMUKHI LETTER I 短母音[ɪ]を表す。 i
U+0A08 GURMUKHI LETTER II 長母音[iː]を表す。 ī
U+0A09 GURMUKHI LETTER U 短母音[ʊ]を表す。 u
U+0A0A GURMUKHI LETTER UU 長母音[uː]を表す。 ū
U+0A0B (予約済) [2]
U+0A0C (予約済) [3]
U+0A0D (予約済) ê
U+0A0E (予約済) ĕ
U+0A0F GURMUKHI LETTER EE 長母音[eː]を表す。 e
U+0A10 GURMUKHI LETTER AI 長母音[ɛː]を表す。 ai
U+0A11 (予約済) ô
U+0A12 (予約済) ŏ
U+0A13 GURMUKHI LETTER OO 長母音[oː]を表す。 o
U+0A14 GURMUKHI LETTER AU 長母音[ɔː]を表す。 au
子音字
U+0A15 GURMUKHI LETTER KA 子音[k]を表す。 k
U+0A16 GURMUKHI LETTER KHA 子音[kʰ]を表す。 kh
U+0A17 GURMUKHI LETTER GA 子音[ɡ]を表す。 g
U+0A18 GURMUKHI LETTER GHA 子音[ɡʱ]を表す。 gh
U+0A19 GURMUKHI LETTER NGA 子音[ŋ]を表す。
U+0A1A GURMUKHI LETTER CA 子音[c]を表す。 c
U+0A1B GURMUKHI LETTER CHA 子音[cʰ]を表す。 ch
U+0A1C GURMUKHI LETTER JA 子音[ɟ]を表す。 j
U+0A1D GURMUKHI LETTER JHA 子音[ɟʱ]を表す。 jh
U+0A1E GURMUKHI LETTER NYA 子音[ɲ]を表す。 ñ
U+0A1F GURMUKHI LETTER TTA 子音[ʈ]を表す。
U+0A20 GURMUKHI LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+0A21 GURMUKHI LETTER DDA 子音[ɖ]を表す。
U+0A22 GURMUKHI LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+0A23 GURMUKHI LETTER NNA 子音[ɳ]を表す。
U+0A24 GURMUKHI LETTER TA 子音[t]を表す。 t
U+0A25 GURMUKHI LETTER THA 子音[tʰ]を表す。 th
U+0A26 GURMUKHI LETTER DA 子音[d]を表す。 d
U+0A27 GURMUKHI LETTER DHA 子音[dʱ]を表す。 dh
U+0A28 GURMUKHI LETTER NA 子音[n]を表す。 n
U+0A29 (予約済)
U+0A2A GURMUKHI LETTER PA 子音[p]を表す。 p
U+0A2B GURMUKHI LETTER PHA 子音[pʰ]を表す。 ph
U+0A2C GURMUKHI LETTER BA 子音[b]を表す。 b
U+0A2D GURMUKHI LETTER BHA 子音[bʱ]を表す。 bh
U+0A2E GURMUKHI LETTER MA 子音[m]を表す。 m
U+0A2F GURMUKHI LETTER YA 子音[j]を表す。 y
U+0A30 GURMUKHI LETTER RA 子音[r]を表す。 r
U+0A31 (予約済) ṟ / r̆[4]
U+0A32 GURMUKHI LETTER LA 子音[l]を表す。 l
U+0A33 ਲ਼ GURMUKHI LETTER LLA 子音[ɭ]を表す。
U+0A34 (予約済)
U+0A35 GURMUKHI LETTER VA 子音[v]を表す。 v
U+0A36 ਸ਼ GURMUKHI LETTER SHA 子音[ʃ]を表す。 ś
U+0A37 (予約済)
U+0A38 GURMUKHI LETTER SA 子音[s]を表す。 s
U+0A39 GURMUKHI LETTER HA 子音[h]を表す。 h
各種記号
U+0A3C GURMUKHI SIGN NUKTA paīr bindī或いはヌクター。子音字を拡張して新たな発音を表す際に用いられる。[5]
従属母音記号
U+0A3E GURMUKHI VOWEL SIGN AA 長母音[ɑː]を表す。 ā
U+0A3F ਿ GURMUKHI VOWEL SIGN I 短母音[ɪ]を表す。 i
U+0A40 GURMUKHI VOWEL SIGN II 長母音[iː]を表す。 ī
U+0A41 GURMUKHI VOWEL SIGN U 短母音[ʊ]を表す。 u
U+0A42 GURMUKHI VOWEL SIGN UU 長母音[uː]を表す。 ū
U+0A43 (予約済) [2]
U+0A44 (予約済) r̥̄[6]
U+0A45 (予約済) ê
U+0A46 (予約済) ĕ
U+0A47 GURMUKHI VOWEL SIGN EE 長母音[eː]を表す。 e
U+0A48 GURMUKHI VOWEL SIGN AI 長母音[ɛː]を表す。 ai
U+0A4B GURMUKHI VOWEL SIGN OO 長母音[oː]を表す。 o
U+0A4C GURMUKHI VOWEL SIGN AU 長母音[ɔː]を表す。 au
ヴィラーマ
U+0A4D GURMUKHI SIGN VIRAMA halant。殺母音記号。デーヴァナーガリーにおけるヴィラーマに相当する。母音/-a/を発音せず子音のみが読まれることを表す。[5]

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にホロント記号が子音字の下に書かれることもある。

記号
U+0A51 GURMUKHI SIGN UDAAT シク教における聖典Adi Granthで高い音で読むことを表す声調記号。[7]
追加の子音字
U+0A59 ਖ਼ GURMUKHI LETTER KHHA 子音[x]を表す。 k͟h
U+0A5A ਗ਼ GURMUKHI LETTER GHHA 子音[ɣ]を表す。 ġ
U+0A5B ਜ਼ GURMUKHI LETTER ZA 子音[z]を表す。 z
U+0A5C GURMUKHI LETTER RRA 子音[ɽ]を表す。

U+0A5D (予約済) ṛh
U+0A5E ਫ਼ GURMUKHI LETTER FA 子音[f]を表す。 f
予約済
U+0A64 (予約済) .
U+0A65 (予約済)
数字
U+0A66 GURMUKHI DIGIT ZERO グルムキー文字における数字の0 0
U+0A67 GURMUKHI DIGIT ONE グルムキー文字における数字の1 1
U+0A68 GURMUKHI DIGIT TWO グルムキー文字における数字の2 2
U+0A69 GURMUKHI DIGIT THREE グルムキー文字における数字の3 3
U+0A6A GURMUKHI DIGIT FOUR グルムキー文字における数字の4 4
U+0A6B GURMUKHI DIGIT FIVE グルムキー文字における数字の5 5
U+0A6C GURMUKHI DIGIT SIX グルムキー文字における数字の6 6
U+0A6D GURMUKHI DIGIT SEVEN グルムキー文字における数字の7 7
U+0A6E GURMUKHI DIGIT EIGHT グルムキー文字における数字の8 8
U+0A6F GURMUKHI DIGIT NINE グルムキー文字における数字の9 9
記号
U+0A70 GURMUKHI TIPPI 鼻音化を表す。[5]
U+0A71 GURMUKHI ADDAK 後続する子音字を重子音として読むことを表す。[5]
母音基字
U+0A72 GURMUKHI IRI 独立母音字i, īの母音記号が付かない形。
U+0A73 GURMUKHI URA 独立母音字u, ūの母音記号が付かない形。
記号
U+0A74 GURMUKHI EK ONKAR シク教において「神は一つ」を表す記号。[5]
U+0A75 GURMUKHI SIGN YAKASH 暗黙の母音/-a/を伴わない子音[j]を表す。[8]
U+0A76 GURMUKHI ABBREVIATION SIGN グルムキー文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。文字の中央の高さに書かれる点。[9]

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「記号」(Sign)、「追加の子音字」(Additional consonants)、「予約済」(Reserved)、「数字」(Digits)、「母音基字」(Vowel bases)の10個となっている。[5]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはグルムキー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはグルムキー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはグルムキー文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号(Dependent vowel signs

編集

この小分類にはグルムキー文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ(Virama

編集

この小分類にはグルムキー文字のうち、halant(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にhalantが子音字の下に付く場合もある。

なお、小分類名のヴィラーマはhalantと等価の記号のデーヴァナーガリー(ヒンディー語)における名称である。

記号(Signs

編集

この小分類にはグルムキー文字のうち、様々な目的で用いられる記号類が収録されている。

追加の子音字(Additional consonants

編集

この小分類にはグルムキー文字のうち、元々のブラーフミー文字にない拡張子音字が収録されている。

ヌクター付きの3つの子音字は、CompositionExclusions.txt にリストされており、正規化中に再構成されない。これらの文字のNFC 形式は、分解されたシーケンスと同じである。[5]

予約済(Reserved

編集

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[5]

数字(Digits

編集

この小分類にはグルムキー文字で用いられる固有の数字が収録されている。

母音基字(Vowel bases

編集

この小分類にはグルムキー文字のうち、母音字i,īやu,ūの母音記号の付かない形が収録されている。

文字コード

編集
グルムキー文字(Gurmukhi)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0A0x
U+0A1x
U+0A2x
U+0A3x ਿ
U+0A4x
U+0A5x
U+0A6x
U+0A7x
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 U+0A02,0A05..0A0A,0A0F..0A10,0A13..0A28,0A2A..0A30,

0A32..0A33,0A35..0A36,0A38..0A39,0A3C,0A3E..0A42, 0A47..0A48,0A4B..0A4C,0A59..0A5C,0A5E,0A66..0A74

87 (to be determined)
1.1 U+0A4D 1 (to be determined)
4.0 U+0A01,0A03 2 (to be determined)
5.1 U+0A51 1 L2/05-384 Sukhjinder Sidhu (30 December 2005), Proposal to encode Gurmukhi Udaat (See also L2/05-344) (英語)
U+0A75 1 L2/06-037 Sukhjinder Sidhu (30 January 2006), Proposal to encode Gurmukhi Sign Yakash (revised 2006/04/07) (英語)
L2/16-294 Sarabveer Singh (27 October 2016), Changes to Gurmukhi 10 (英語)
L2/16-302 Shriramana Sharma (28 October 2016), Feedback on L2/16-294 on Gurmukhi (英語)
L2/16-380 Manvir Singh (9 December 2016), Feedback on L2/16-294 (Gurmukhi Sign Yakash) (英語)
L2/16-384 Sarabveer Singh (27 December 2016), Feedback on L2/16-380 (Gurmukhi) (英語)
11.0 U+0A76 1 L2/16-209 Srinidhi A; Sridatta A (15 August 2016), Proposal to Encode an Abbreviation Sign for Gurmukhi (revised) (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年6月26日閲覧。
  2. ^ a b IASTではṛと表記される。
  3. ^ IASTではḷと表記される。
  4. ^ まつ毛のRの時はr̆となる。
  5. ^ a b c d e f g h "The Unicode Standard, Version 15.1 - U0A00.pdf" (PDF). The Unicode Standard (英語). 2024年6月28日閲覧
  6. ^ IASTではṝと表記される。
  7. ^ Sukhjinder Sidhu (2005年12月30日). “Proposal to encode Gurmukhi Udaat (See also L2/05-344)” (英語). Unicode. 2024年6月28日閲覧。
  8. ^ Sukhjinder Sidhu (2006年1月30日). “Proposal to encode Gurmukhi Sign Yakash (revised 2006/04/07)” (英語). Unicode. 2024年6月28日閲覧。
  9. ^ Srinidhi A; Sridatta A (2016年8月15日). “Proposal to Encode an Abbreviation Sign for Gurmukhi (revised)” (英語). Unicode. 2024年6月28日閲覧。

関連項目

編集