ラオス文字 (Unicodeのブロック)

ラオス文字(ラオスもじ、英語: Lao)は、Unicodeの34個目のブロック

ラオス文字 (Unicodeのブロック)
Lao
範囲 U+0E80..U+0EFF
(128 個の符号位置)
基本多言語面
用字 ラオス文字
主な言語・文字体系
割当済 82 個の符号位置
未使用 46 個の保留
Unicodeのバージョン履歴
1.0.0 64 (+64)
6.1 66 (+2)
12.0 81 (+15)
15.0 82 (+1)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

解説

編集

東南アジアラオス人民民主共和国の公用語であるラーオ語を表記するためのラオス文字を収録している。

ラオス文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字に母音記号を付加することで発音を切り替えるアブギダに分類される。隣国タイで用いられるタイ文字とは近縁関係にある。

母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加される。なお、このような母音記号は多くのブラーフミー系文字では実際の発音の順序に合わせてレンダー位置が入れ替わることが多いが、タイ文字同様にラオス文字では文字が書かれる順序通りに入力することとなっている。

デーヴァナーガリー文字などのインドの文字とは異なり、頭子音のない独立した母音を表す文字が存在しない。代わりに頭子音のない母音を表す場合は無子音、あるいは声門破裂音[ʔ]を表す子音字オー・オー(U+0EAD ອ)を用いて表現する。また、子音連続は単に子音字を連続して書くことで表され、南アジアの文字体系で用いられるヴィラーマのような記号は通常は使われない(例外的にパーリ語の音訳においては似たような記号が用いられる。U+0EBA ຺ LAO SIGN PALI VIRAMAを参照)。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送る。分かち書きは原則しない

子音字は元々有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別していた。そのため、各調音点における破裂音には計4種類の子音字が存在していた。なお、現在のラーオ語では有声無気音及び有声有気音は廃字となっており、上座部仏教の聖典言語であるパーリ語の音訳など限定的な用法でしか用いられなくなっている。現在はこれらの有気音/無気音、有声音/無声音の弁別の代わりに声調の規則の変化が対応付けられており、子音字にはその規則ごとに中子音字・高子音字・低子音字の3つのグループに大別される。子音字は末子音としても振舞うことがあり、その場合一部の文字については発音が変化する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむねブラーフミー系文字の文字順に由来する伝統的なラオス文字の順序に従っている。なお、文字名についてはタイ文字ブロックとは異なり、ラオス文字の伝統的な文字名ではなく、子音に随伴母音/-o/を伴った文字名で命名されている。同じ発音に対して高子音字と低子音字で文字が分かれている場合については高子音字には"SUNG"、低子音字には"TAM"という単語が付けられている。

加えて、アラビア文字やデーヴァナーガリーなどと同様に独自の数字体系(ラオス数字)を有している。

Unicodeのバージョン1.0においても「ラオス文字(Lao)」というブロック名で制定されていた[1]

収録文字

編集

ラテン文字転写」の列はラオス文字のラテン文字への翻字方式の一つであるALA-LC ラテン文字翻字法英語版に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
子音字
U+0E81 LAO LETTER KO ゴー・ガイ(ko kai; 鶏のゴー)。

子音[k]を表す中子音字。

k
U+0E82 LAO LETTER KHO SUNG コー・カイ(kho khai; 卵のコー)。

子音[kʰ]を表す高子音字。

kh
U+0E83 (予約済み)
U+0E84 LAO LETTER KHO TAM コー・クワイ(kho khwai; 水牛のコー)。

子音[kʰ]を表す低子音字。元々は有声無気音[ɡ]だった。

kh/g[2]
U+0E85 (予約済み)
U+0E86 LAO LETTER PALI GHA パーリ語で用いられる。

子音[ɡʰ]を表す低子音字。

gh
U+0E87 LAO LETTER NGO コ゚ー・ク゚ー(ngo ngu; 蛇のコ゚ー)或いはコ゚ー・ク゚ーア(ngo ngua; 牛のコ゚ー)。

子音[ŋ]を表す低子音字。

ng
U+0E88 LAO LETTER CO チョー・チョーク(co cok; コップのチョー)。

子音[t͡ɕ]を表す中子音字。

ch/c[2]
U+0E89 LAO LETTER PALI CHA パーリ語で用いられる。

子音[tɕʰ]を表す高子音字。

ch
U+0E8A LAO LETTER SO TAM ソー・サーン(so sang; 象のソー)。

子音[s]を表す低子音字。元々は有声無気音[d͡ʑ]だった。

s/j[2]
U+0E8B (予約済み)
U+0E8C LAO LETTER PALI JHA パーリ語で用いられる。

子音[d͡ʑʱ]を表す低子音字。

jh
U+0E8D LAO LETTER NYO ニョー・ニュン(nyo nyung; 蚊のニョー)

子音[ɲ]を表す低子音字。

ny
U+0E8E LAO LETTER PALI NYA パーリ語で用いられる。

子音[ɲ]を表す低子音字。

ñ
U+0E8F LAO LETTER PALI TTA パーリ語で用いられる。

子音[ʈ]を表す中子音字。

U+0E90 LAO LETTER PALI TTHA パーリ語で用いられる。

子音[ʈʰ]を表す高子音字。

ṭh
U+0E91 LAO LETTER PALI DDA パーリ語で用いられる。

子音[ɖ]を表す低子音字。

U+0E92 LAO LETTER PALI DDHA パーリ語で用いられる。

子音[ɖʱ]を表す低子音字。

ḍh
U+0E93 LAO LETTER PALI NNA パーリ語で用いられる。

子音[ɳ]を表す低子音字。

U+0E94 LAO LETTER DO ドー・デック(do dek; 子供のドー)。

子音[d]を表す中子音字。

d
U+0E95 LAO LETTER TO トー・ター(to ta; 目のトー)。

子音[t]を表す中子音字。do dek(ດ)から分化した字。

t
U+0E96 LAO LETTER THO SUNG トー・トン(tho thong; 袋のトー)。

子音[tʰ]を表す高子音字。

th
U+0E97 LAO LETTER THO TAM トー・トゥン(tho thung; 旗のトー)

子音[tʰ]を表す低子音字。元々は有声無気音[d]だった。

th/d[2]
U+0E98 LAO LETTER PALI DHA パーリ語で用いられる。

子音[dʱ]を表す低子音字。

dh
U+0E99 LAO LETTER NO ノー・ノック (no nok; 鳥のノー)。

子音[n]を表す低子音字。

n
U+0E9A LAO LETTER BO ボー・ベー(bo bae; 羊のボー)。

子音[b]を表す中子音字。

b
U+0E9B LAO LETTER PO ポー・パー(po pa; 魚のポー)。

子音[p]を表す中子音字。bo bae(ບ)から分化した字。

p
U+0E9C LAO LETTER PHO SUNG ポー・プン(pho phueng; 蜂のポー)。

子音[pʰ]を表す高子音字。

ph
U+0E9D LAO LETTER FO TAM フォー・フォン(fo fon; 雨のフォー)。

子音[f]を表す高子音字。pho phueng(ຜ)から分化した字。

文字名の"FO TAM(低子音字のフォー)"は"FO SUNG(高子音字のフォー)"の誤りである。[3]

f
U+0E9E LAO LETTER PHO TAM ポー・プー(pho phu; 山のポー)。

子音[pʰ]を表す低子音字。元々は有声無気音[b]だった。

ph/b[2]
U+0E9F LAO LETTER FO SUNG フォー・ファイ(fo fai; 火のフォー)。

子音[f]を表す低子音字。pho phu(ພ)から分化した字。

文字名の"FO SUNG(高子音字のフォー)"は"FO TAM(低子音字のフォー)"の誤りである。[3]

f
U+0EA0 LAO LETTER PALI BHA パーリ語で用いられる。

子音[bʱ]を表す低子音字。

bh
U+0EA1 LAO LETTER MO モー・メーウ(mo maew; 猫のモー)。

子音[m]を表す低子音字。

m
U+0EA2 LAO LETTER YO ヨー・ヤー(yo ya; 薬のヨー)。

子音[j]を表す中子音字。

なお、対応するタイ文字yo yak(ย)は低子音字である。

y
U+0EA3 LAO LETTER LO LING ロー・ロット(ro rot; 車のロー)或いはロー・ラカン(ro rakhang; 鐘のロー)。

子音[l]を表す低子音字。元々は[r]を表していた。

なお、Unicodeの文字名lo lingは間違っており、0EA5 ລのものと入れ替わってしまっている。

r
U+0EA4 (予約済み)
U+0EA5 LAO LETTER LO LOOT ロー・リーン(lo ling; 猿のロー)。

子音[l]を表す低子音字。

なお、Unicodeの文字名lo lootは間違っており、0EA3 ຣのものと入れ替わってしまっている。

l
U+0EA6 (予約済み)
U+0EA7 LAO LETTER WO ウォー・ウィー(wo wi; 扇のウォー)。

子音[w]を表す低子音字。

v
U+0EA8 LAO LETTER SANSKRIT SHA サンスクリット語で用いられる。

子音[ɕ]を表す高子音字。

ś
U+0EA9 LAO LETTER SANSKRIT SSA サンスクリット語で用いられる。

子音[ʂ]を表す高子音字。

U+0EAA LAO LETTER SO SUNG ソー・スーア(so suea; 虎のソー)。

子音[s]を表す高子音字。

現在のラオス文字の順序では通常so sang(ຊ)の直前に置かれるが、Unicodeではブラーフミー系文字における順序に倣いこの位置となっている。

s
U+0EAB LAO LETTER HO SUNG ホー・ハーン(ho han; 鵞鳥のホー)。

子音[h]を表す高子音字。

低子音字の文字の声調タイプを高子音字に置き換えるための文字としても用いられる。

h
U+0EAC LAO LETTER PALI LLA パーリ語で用いられる。

子音[ɭ]を表す低子音字。

U+0EAD LAO LETTER O オー・オー('o 'o; 桶のオー)。

子音[ʔ]あるいは頭子音が無いことを表す中子音字。

母音[ə]及び[ɔ]とそれらの長母音を表す際にも用いられる。

'
U+0EAE LAO LETTER HO TAM ホー・フーアン(ho huean; 家のホー)。

子音[h]を表す低子音字。

h
記号
U+0EAF LAO ELLIPSIS ラオス文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。 .
母音記号
U+0EB0 THAI CHARACTER SARA A 末子音が無い場合の短母音[a]を表す。 a
U+0EB1 LAO VOWEL SIGN MAI KAN 末子音が有る場合の短母音[a]を表す。

或いは、母音/e/や/ɛ/などが末子音を伴う短母音であることを表す。

a
U+0EB2 LAO VOWEL SIGN AA 長母音[aː]を表す。 ā
U+0EB3 ໍາ LAO VOWEL SIGN AM 鼻母音[ɑm]を表す。 am
U+0EB4 LAO VOWEL SIGN I 短母音[i]を表す。 i
U+0EB5 LAO VOWEL SIGN II 長母音[iː]を表す。 ī
U+0EB6 LAO VOWEL SIGN Y 短母音[ɯ]を表す。 ư
U+0EB7 LAO VOWEL SIGN YY 長母音[ɯː]を表す。 ư̄
U+0EB8 LAO VOWEL SIGN U 短母音[u]を表す。 u
U+0EB9 LAO VOWEL SIGN UU 長母音[uː]を表す。 ū
ヴィラーマ
U+0EBA LAO SIGN PALI VIRAMA パーリ語においてヴィラーマ(無母音)の音訳に用いられる。
母音記号
U+0EBB LAO VOWEL SIGN MAI KON 末子音を伴う短母音の[o]を表す。
記号
U+0EBC LAO SEMIVOWEL SIGN LO
U+0EBD LAO SEMIVOWEL SIGN NYO 二重母音[ia]や[aːɪ]の表記に用いられる。
母音記号
U+0EC0 LAO VOWEL SIGN E 短母音[e]を表す。 e
U+0EC1 LAO VOWEL SIGN EI 短母音[ɛ]を表す。 æ
U+0EC2 LAO VOWEL SIGN O 短母音[o]を表す。 o
U+0EC3 LAO VOWEL SIGN AY 二重母音[aɪ]を表す。 ai
U+0EC4 LAO VOWEL SIGN AI 二重母音[aɪ]を表す。 ai
繰り返し記号
U+0EC6 LAO KO LA 直前の単語を2回繰り返して発音することを表す記号。日本語における「」などにあたる。
声調記号
U+0EC8 LAO TONE MAI EK マーイ・エーク(ໄມ້ເອກ)。子音字の声調を変化させることを表す記号。第1段階。数字の1に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

U+0EC9 LAO TONE MAI THO マーイ・トー(ໄມ້ໂທ)。子音字の声調を変化させることを表す記号。第2段階。数字の2に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

U+0ECA LAO TONE MAI TI マーイ・ティー(ໄມ້ຕີ)。子音字の声調を変化させることを表す記号。第3段階。数字の3に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

U+0ECB LAO TONE MAI CATAWA マーイ・チャッタワー(ໄມ້ຈັດຕະວາ)。子音字の声調を変化させることを表す記号。第4段階。数字の4に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

記号
U+0ECC LAO CANCELLATION MARK 子音字の上に付き、語源の都合で書かれているが実際には発音されない黙字を表す記号。黙字符[3]
U+0ECD LAO NIGGAHITA サンスクリット語パーリ語の音訳において鼻母音化を表す、或いは長母音の[oː]を表す[3]アヌスヴァーラに対応する。

現在のラーオ語では母音am(ໍາ)にその名残がある。

U+0ECE LAO YAMAKKAN パーリ語においてヴィラーマと同様の働き(無母音化)をする。同時に発音される2つの子音クラスターの一部である子音を示す[3]
数字
U+0ED0 LAO DIGIT ZERO ラオス文字における数字の0 0
U+0ED1 LAO DIGIT ONE ラオス文字における数字の1 1
U+0ED2 LAO DIGIT TWO ラオス文字における数字の2 2
U+0ED3 LAO DIGIT THREE ラオス文字における数字の3 3
U+0ED4 LAO DIGIT FOUR ラオス文字における数字の4 4
U+0ED5 LAO DIGIT FIVE ラオス文字における数字の5 5
U+0ED6 LAO DIGIT SIX ラオス文字における数字の6 6
U+0ED7 LAO DIGIT SEVEN ラオス文字における数字の7 7
U+0ED8 LAO DIGIT EIGHT ラオス文字における数字の8 8
U+0ED9 LAO DIGIT NINE ラオス文字における数字の9 9
二重音字
U+0EDC LAO HO NO 子音[n]を表す高子音字。 hn
U+0EDD LAO HO MO 子音[m]を表す高子音字。 hm
クム語用子音字
U+0EDE LAO LETTER KHMU GO クム語英語版で子音[ɡ]を表す[4] g
U+0EDF LAO LETTER KHMU NYO クム語英語版で末子音の[ɲ]を表す[4] ñ

小分類

編集

このブロックの小分類は「子音字」(Consonants)、「記号」(Signs)、「母音記号」(Vowels)、「ヴィラーマ」(Virama)、「繰り返し記号」(Repetition mark)、「声調記号」(Tone marks)、「数字」(Digits)、「二重音字」(Digraphs)、「クム語用子音字」(Consonants for Khmu)の9つとなっている[3]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

子音字(Consonants

編集

この小分類にはラオス文字のうち、基本的な子音字が収録されている。

記号(Signs

編集

この小分類にはラオス文字のうち、記号約物などの類が収録されている。

母音記号(Vowels

編集

この小分類にはラオス文字のうち、子音字に結合する母音記号が収録されている。U+0EC0-0E44の文字については、視覚的な順序では子音の前にある。[3]他のブラーフミー系文字では子音の左側にレンダーされる母音記号を発音順に入力する方式を取っているものが多いが、タイ文字では文字が書かれる順番通りに入力することとなっている。そのため、文字の符号化文字列とレンダー位置とか入れ替わることは無い。

ヴィラーマ(Virama

編集

この小分類にはラオス文字のうち、パーリ語の表記において子音のみで発音することを表すヴィラーマ記号を翻字する際に用いられる記号1つのみが収録されている。

繰り返し記号(Repetition mark

編集

この小分類にはラオス文字において直前の単語を2回繰り返して読むことを表す繰り返し記号1つのみが収録されている。

声調記号(Tone marks

編集

この小分類にはラオス文字のうち、子音の声調を変化させるための記号が収録されている。なお、1つの声調記号に対して声調が一対一で対応しているわけではなく、付けられた先の子音が高子音字・中子音字・低子音字のうちいずれのグループに属するかによって声調の規則が異なる。

数字(Digits

編集

この小分類にはラオス文字で用いられる固有の数字が収録されている。

二重音字(Digraphs

編集

この小分類にはラオス文字のうち、高子音字化するためにホー・ハーン(U+0EAB ຫ)と合成された鼻音の子音字の合字二つが収録されている。

クム語用子音字(Consonants for Khmu

編集

この小分類にはラオス文字のうち、ラオス国内に居住する少数民族が話すオーストロアジア語族クム語英語版の表記に用いられる拡張子音字2つが収録されている。Unicodeのバージョン6.1で追加された。

文字コード

編集
ラオス文字(Lao)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E8x
U+0E9x
U+0EAx
U+0EBx
U+0ECx
U+0EDx
U+0EEx
U+0EFx
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 87 (to be determined)
6.1 U+0EDE..0EDF 2 L2/10-335 Martin Hosken (14 October 2010), Proposal to add minority characters to Lao script (revised; WG2 N3893R) (英語)
12.0 U+0E86,0E89,0E8C,0E8E..0E93,0E98,0EA0,0EA8..0EA9,0EAC,0EBA 15 L2/17-106 Vinodh Rajan; Ben Mitchell; Martin Jansche; Sascha Brawer (19 July 2017), Proposal to Encode Lao Characters for Pali (revised) (英語)
L2/17-285 Weizhe Zheng; Yihua Wang (2 August 2017), Comments on the encoding of Lao Letters Pali JHA and NYA (英語)
15.0 U+0ECE 1 L2/21-093 Vinodh Rajan; Jayasāro Bhikkhu (23 April 2021), Proposal to Encode Lao Yamakkan (英語)
L2/21-143 Vinodh Rajan (26 July 2021), Response to Comments on Lao Yamakkan (英語)
(提案中) Thai Noi / Lao Buhan script L2/18-072 Ben Mitchell (5 March 2018), Towards a comprehensive proposal for Thai Noi / Lao Buhan script (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b c d e パーリ語においては右側で転写。
  3. ^ a b c d e f g "The Unicode Standard, Version 15.1 - U0E80.pdf" (PDF). The Unicode Standard (英語). 2024年8月9日閲覧
  4. ^ a b Martin Hosken (2010年10月14日). “Proposal to add minority characters to Lao script (revised; WG2 N3893R)” (英語). Unicode. 2024年8月9日閲覧。

関連項目

編集