カンナダ文字 (Unicodeのブロック)
カンナダ文字(カンナダもじ、英語: Kannada)は、Unicodeの30個目のブロック。
カンナダ文字 (Unicodeのブロック) | |
---|---|
Kannada | |
範囲 |
U+0C80..U+0CFF (128 個の符号位置) |
面 | 基本多言語面 |
用字 | カンナダ文字 |
主な言語・文字体系 | |
割当済 | 89 個の符号位置 |
未使用 | 39 個の保留 |
Unicodeのバージョン履歴 | |
1.0.0 | 78 (+78) |
4.0 | 80 (+2) |
5.0 | 84 (+4) |
7.0 | 85 (+1) |
9.0 | 86 (+1) |
11.0 | 87 (+1) |
14.0 | 88 (+1) |
15.0 | 89 (+1) |
公式ページ | |
コード表 ∣ ウェブページ |
解説
編集インド南西部のカルナータカ州で話されているドラヴィダ語族のカンナダ語やトゥル語を表記するためのカンナダ文字を収録している。
カンナダ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(カンナダ数字)を有している。
Unicodeのバージョン1.0においても「カンナダ文字(Kannada)」というブロック名で制定されていた[1]。
収録文字
編集「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
各種記号 | ||||
U+0C80 | ಀ | KANNADA SIGN SPACING CANDRABINDU | ||
U+0C81 | ಁ | KANNADA SIGN CANDRABINDU | アヌナーシカ、或いはチャンドラビンドゥ。
母音字や母音記号に付き、母音を鼻母音で発音することを表す。 |
m̐ |
U+0C82 | ಂ | KANNADA SIGN ANUSVARA | アヌスヴァーラ、或いはビンドゥ。
直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。日本語における「ん」に相当する。 コンカニ語、ハヴィヤカ・カンナダ語(ハヴィガンナダ語)、およびアワディー語において通常のアヌスヴァーラを示すのに用いられる。[2] |
ṁ |
U+0C83 | ಃ | KANNADA SIGN VISARGA | ヴィサルガ。
音節末に[h]を伴うことを表す。 |
ḥ |
U+0C84 | ಄ | KANNADA SIGN SIDDHAM | テキストの冒頭で祈りの言葉(invocation)として使用される。 | |
独立母音字 | ||||
U+0C85 | ಅ | KANNADA LETTER A | 短母音[ʌ]を表す。 | a |
U+0C86 | ಆ | KANNADA LETTER AA | 長母音[ɑː]を表す。 | ā |
U+0C87 | ಇ | KANNADA LETTER I | 短母音[ɪ]を表す。 | i |
U+0C88 | ಈ | KANNADA LETTER II | 長母音[iː]を表す。 | ī |
U+0C89 | ಉ | KANNADA LETTER U | 短母音[ʊ]を表す。 | u |
U+0C8A | ಊ | KANNADA LETTER UU | 長母音[uː]を表す。 | ū |
U+0C8B | ಋ | KANNADA LETTER VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現在のカンナダ語では[ru]と発音される。 |
r̥[3] |
U+0C8C | ಌ | KANNADA LETTER VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。
現在のカンナダ語では[ɭu]と発音される。 |
l̥[4] |
U+0C8D | (予約済) | ê | ||
U+0C8E | ಎ | KANNADA LETTER E | 短母音[e]を表す。 | e |
U+0C8F | ಏ | KANNADA LETTER EE | 長母音[eː]を表す。 | ē |
U+0C90 | ಐ | KANNADA LETTER AI | 二重母音[aɪ]を表す。 | ai |
U+0C91 | (予約済) | ô | ||
U+0C92 | ಒ | KANNADA LETTER O | 短母音[o]を表す。 | o |
U+0C93 | ಓ | KANNADA LETTER OO | 長母音[oː]を表す。 | ō |
U+0C94 | ಔ | KANNADA LETTER AU | 二重母音[aʊ]を表す。 | au |
子音字 | ||||
U+0C95 | ಕ | KANNADA LETTER KA | 子音[k]を表す。 | k |
U+0C96 | ಖ | KANNADA LETTER KHA | 子音[kʰ]を表す。 | kh |
U+0C97 | ಗ | KANNADA LETTER GA | 子音[ɡ]を表す。 | g |
U+0C98 | ಘ | KANNADA LETTER GHA | 子音[ɡʱ]を表す。 | gh |
U+0C99 | ಙ | KANNADA LETTER NGA | 子音[ŋ]を表す。 | ṅ |
U+0C9A | ಚ | KANNADA LETTER CA | 子音[c]を表す。 | c |
U+0C9B | ಛ | KANNADA LETTER CHA | 子音[cʰ]を表す。 | ch |
U+0C9C | ಜ | KANNADA LETTER JA | 子音[ɟ]を表す。 | j |
U+0C9D | ಝ | KANNADA LETTER JHA | 子音[ɟʱ]を表す。 | jh |
U+0C9E | ಞ | KANNADA LETTER NYA | 子音[ɲ]を表す。 | ñ |
U+0C9F | ಟ | KANNADA LETTER TTA | 子音[ʈ]を表す。 | ṭ |
U+0CA0 | ಠ | KANNADA LETTER TTHA | 子音[ʈʰ]を表す。 | ṭh |
U+0CA1 | ಡ | KANNADA LETTER DDA | 子音[ɖ]を表す。 | ḍ |
U+0CA2 | ಢ | KANNADA LETTER DDHA | 子音[ɖʱ]を表す。 | ḍh |
U+0CA3 | ಣ | KANNADA LETTER NNA | 子音[ɳ]を表す。 | ṇ |
U+0CA4 | ತ | KANNADA LETTER TA | 子音[t]を表す。 | t |
U+0CA5 | ಥ | KANNADA LETTER THA | 子音[tʰ]を表す。 | th |
U+0CA6 | ದ | KANNADA LETTER DA | 子音[d]を表す。 | d |
U+0CA7 | ಧ | KANNADA LETTER DHA | 子音[dʱ]を表す。 | dh |
U+0CA8 | ನ | KANNADA LETTER NA | 子音[n]を表す。 | n |
U+0CA9 | (予約済) | ṉ | ||
U+0CAA | ಪ | KANNADA LETTER PA | 子音[p]を表す。 | p |
U+0CAB | ಫ | KANNADA LETTER PHA | 子音[pʰ]を表す。 | ph |
U+0CAC | ಬ | KANNADA LETTER BA | 子音[b]を表す。 | b |
U+0CAD | ಭ | KANNADA LETTER BHA | 子音[bʱ]を表す。 | bh |
U+0CAE | ಮ | KANNADA LETTER MA | 子音[m]を表す。 | m |
U+0CAF | ಯ | KANNADA LETTER YA | 子音[j]を表す。 | y |
U+0CB0 | ರ | KANNADA LETTER RA | 子音[r]を表す。 | r |
U+0CB1 | ಱ | KANNADA LETTER RRA | 子音[ɽ]を表す。 | ṟ |
U+0CB2 | ಲ | KANNADA LETTER LA | 子音[l]を表す。 | l |
U+0CB3 | ಳ | KANNADA LETTER LLA | 子音[ɭ]を表す。 | ḷ |
U+0CB4 | (予約済) | ḻ | ||
U+0CB5 | ವ | KANNADA LETTER VA | 子音[ʋ]を表す。 | v |
U+0CB6 | ಶ | KANNADA LETTER SHA | 子音[ɕ]を表す。 | ś |
U+0CB7 | ಷ | KANNADA LETTER SSA | 子音[ɕ]を表す。
元々は反り舌音の[ʂ]を表していた。 |
ṣ |
U+0CB8 | ಸ | KANNADA LETTER SA | 子音[s]を表す。 | s |
U+0CB9 | ಹ | KANNADA LETTER HA | 子音[h]を表す。 | h |
各種記号 | ||||
U+0CBC | ಼ | KANNADA SIGN NUKTA | ヌクター。子音字を拡張して新たな発音を表す際に用いられる。 | |
U+0CBD | ಽ | KANNADA SIGN AVAGRAHA | アヴァグラハ。連音(サンディ)によって語頭の母音 a が消えたことを表す。 | ’ |
従属母音記号 | ||||
U+0CBE | ಾ | KANNADA VOWEL SIGN AA | 長母音[ɑː]を表す。 | ā |
U+0CBF | ಿ | KANNADA VOWEL SIGN I | 短母音[ɪ]を表す。 | i |
U+0CC0 | ೀ | KANNADA VOWEL SIGN II | 長母音[iː]を表す。 | ī |
U+0CC1 | ು | KANNADA VOWEL SIGN U | 短母音[ʊ]を表す。 | u |
U+0CC2 | ೂ | KANNADA VOWEL SIGN UU | 長母音[uː]を表す。 | ū |
U+0CC3 | ೃ | KANNADA VOWEL SIGN VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現代のカンナダ語では[ru]と発音される。 |
r̥[3] |
U+0CC4 | ೄ | KANNADA VOWEL SIGN VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のカンナダ語では[ruː]と発音される。 |
r̥̄[5] |
U+0CC5 | (予約済) | ê | ||
U+0CC6 | ೆ | KANNADA VOWEL SIGN E | 短母音[e]を表す。 | e |
U+0CC7 | ೇ | KANNADA VOWEL SIGN EE | 長母音[eː]を表す。 | ē |
U+0CC8 | ೈ | KANNADA VOWEL SIGN AI | 二重母音[aɪ]を表す。 | ai |
U+0CC9 | (予約済) | ô | ||
U+0CCA | ೊ | KANNADA VOWEL SIGN O | 短母音[o]を表す。 | o |
U+0CCB | ೋ | KANNADA VOWEL SIGN OO | 長母音[oː]を表す。 | ō |
U+0CCC | ೌ | KANNADA VOWEL SIGN AU | 二重母音[aʊ]を表す。 | au |
ヴィラーマ | ||||
U+0CCD | ್ | KANNADA SIGN VIRAMA | ハラント(halant)[2]、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。
レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にハラント記号が子音字の上に書かれることもある。 |
|
各種記号 | ||||
U+0CD5 | ೕ | KANNADA LENGTH MARK | ||
U+0CD6 | ೖ | KANNADA AI LENGTH MARK | ||
追加の子音字 | ||||
U+0CDD | ౝ | KANNADA LETTER NAKAARA POLLU | 随伴母音/-a/を伴わない子音[n]を表す。[2] | |
U+0CDE | ೞ | KANNADA LETTER FA | 子音[ɻ]を表していた。現在は使用されていない。[2]
なお、文字名が"FA"となっているが、これは"LLLA"の誤りである。[2] |
ḻ |
サンスクリット語用の追加母音字 | ||||
U+0CE0 | ೠ | KANNADA LETTER VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のカンナダ語では[ruː]と発音される。 |
r̥̄[5] |
U+0CE1 | ೡ | KANNADA LETTER VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。
現在のカンナダ語では[ɭuː]と発音される。 |
l̥̄[6] |
従属母音記号 | ||||
U+0CE2 | ೢ | KANNADA VOWEL SIGN VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。
現在のカンナダ語では[ɭu]と発音される。 |
l̥[4] |
U+0CE3 | ೣ | KANNADA VOWEL SIGN VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。
現在のカンナダ語では[ɭuː]と発音される。 |
l̥̄[6] |
予約済 | ||||
U+0CE4 | (予約済) | . | ||
U+0CE5 | (予約済) | |||
数字 | ||||
U+0CE6 | ೦ | KANNADA DIGIT ZERO | カンナダ文字における数字の0。 | 0 |
U+0CE7 | ೧ | KANNADA DIGIT ONE | カンナダ文字における数字の1。 | 1 |
U+0CE8 | ೨ | KANNADA DIGIT TWO | カンナダ文字における数字の2。 | 2 |
U+0CE9 | ೩ | KANNADA DIGIT THREE | カンナダ文字における数字の3。 | 3 |
U+0CEA | ೪ | KANNADA DIGIT FOUR | カンナダ文字における数字の4。 | 4 |
U+0CEB | ೫ | KANNADA DIGIT FIVE | カンナダ文字における数字の5。 | 5 |
U+0CEC | ೬ | KANNADA DIGIT SIX | カンナダ文字における数字の6。 | 6 |
U+0CED | ೭ | KANNADA DIGIT SEVEN | カンナダ文字における数字の7。 | 7 |
U+0CEE | ೮ | KANNADA DIGIT EIGHT | カンナダ文字における数字の8。 | 8 |
U+0CEF | ೯ | KANNADA DIGIT NINE | カンナダ文字における数字の9。 | 9 |
サンスクリット語において用いられた記号 | ||||
U+0CF1 | ೱ | KANNADA SIGN JIHVAMULIYA | ||
U+0CF2 | ೲ | KANNADA SIGN UPADHMANIYA | ||
U+0CF3 | ೳ | KANNADA SIGN COMBINING ANUSVARA ABOVE RIGHT | コンカニ語、ハヴィヤカ・カンナダ語(ハヴィガンナダ語)、およびアワディー語においてアヌナーシカ(anunāsikā、鼻母音化)を示すのに用いられる。[2][7] |
小分類
編集このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「サンスクリット語において用いられた記号」(Signs used in Sanskrit)の10個となっている[8]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
編集この小分類にはカンナダ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
編集この小分類にはカンナダ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
編集この小分類にはカンナダ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
従属母音記号(Dependent vowel signs)
編集この小分類にはカンナダ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。
ヴィラーマ(Virama)
編集この小分類にはカンナダ文字のうち、ハラント(halant)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。
追加の子音字(Additional consonants)
編集この小分類にはカンナダ文字のうち、借用語などで用いられる拡張子音字が収録されている。
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
編集この小分類にはカンナダ文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
編集この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する[2]。
数字(Digits)
編集この小分類にはカンナダ文字で用いられる固有の数字が収録されている。
サンスクリット語において用いられた記号(Signs used in Sanskrit)
編集この小分類にはカンナダ文字のうち、サンスクリット語において用いられた記号3つが収録されている。
文字コード
編集カンナダ文字(Kannada)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0C8x | ಀ | ಁ | ಂ | ಃ | ಄ | ಅ | ಆ | ಇ | ಈ | ಉ | ಊ | ಋ | ಌ | ಎ | ಏ | |
U+0C9x | ಐ | ಒ | ಓ | ಔ | ಕ | ಖ | ಗ | ಘ | ಙ | ಚ | ಛ | ಜ | ಝ | ಞ | ಟ | |
U+0CAx | ಠ | ಡ | ಢ | ಣ | ತ | ಥ | ದ | ಧ | ನ | ಪ | ಫ | ಬ | ಭ | ಮ | ಯ | |
U+0CBx | ರ | ಱ | ಲ | ಳ | ವ | ಶ | ಷ | ಸ | ಹ | ಼ | ಽ | ಾ | ಿ | |||
U+0CCx | ೀ | ು | ೂ | ೃ | ೄ | ೆ | ೇ | ೈ | ೊ | ೋ | ೌ | ್ | ||||
U+0CDx | ೕ | ೖ | ೝ | ೞ | ||||||||||||
U+0CEx | ೠ | ೡ | ೢ | ೣ | ೦ | ೧ | ೨ | ೩ | ೪ | ೫ | ೬ | ೭ | ೮ | ೯ | ||
U+0CFx | ೱ | ೲ | ೳ | |||||||||||||
注釈
|
履歴
編集以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
1.0.0 | 78 | (to be determined) | ||
4.0 | U+0CBC..0CBD | 2 | (to be determined) | |
5.0 | U+0CE2..0CE3 | 2 | L2/04-364 | Michael Everson (21 October 2004), Proposal to add six characters for Kannada to the BMP (WG2 N2860) (英語) |
U+0CF1..0CF2 | 2 | L2/04-364 | Michael Everson (21 October 2004), Proposal to add six characters for Kannada to the BMP (WG2 N2860) (英語) | |
L2/13-242 | Srinidhi (23 December 2013), Representation of Jihvamuliya and Upadhmaniya in Kannada (英語) | |||
L2/14-066 | Shriramana Sharma (6 February 2014), Representation of the Brahmi and Kannada Jihvamuliya/Upadhmaniya Characters in the Code Charts (英語) | |||
7.0 | U+0C81 | 1 | (to be determined) | |
9.0 | U+0C80 | 1 | L2/14-153 | Vinodh Rajan (18 July 2014), Proposal to encode Kannada Sign Spacing Candrabindu (英語) |
L2/14-166 | Srinidhi (25 July 2014), Usage of Kannada Sign Spacing Candrabindu in Vedic texts (英語) | |||
L2/14-188 | Shriramana Sharma (1 August 2014), Comments on proposal for Kannada Sign Spacing Candrabindu (英語) | |||
L2/15-158 | Shriramana Sharma (20 May 2015), Attestations for Sama Vedic usage of 0C80 KANNADA SIGN SPACING CANDRABINDU (英語) | |||
11.0 | U+0C84 | 1 | L2/16-031 | Srinidhi A; Sridatta A (22 January 2016), Proposal to encode the Kannada sign SIDDHAM in Unicode (英語) |
14.0 | U+0CDD | 1 | L2/13-228 | Shriramana Sharma (26 November 2013), The Kannada "nakaara-pollu" (英語) |
L2/20-228 | Srinidhi A; Sridatta A (7 January 2021), Proposal to encode Kannada sign Nakaara Pollu (revised) (英語) | |||
15.0 | U+0CF3 | 1 | L2/20-260 | Shashank Shenoy Basty (1 October 2020), Preliminary Proposal to Encode Kannada Sign Combining Anusvara Right Top (英語) |
L2/21-114 | Shashank Shenoy Basty (29 June 2021), Proposal to Encode Kannada Sign Combining Anusvara Above Right (英語) | |||
|
出典
編集- ^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
- ^ a b c d e f g "The Unicode Standard, Version 15.1 - U0C80.pdf" (PDF). The Unicode Standard (英語). 2024年7月30日閲覧。
- ^ a b IASTではṛと表記される。
- ^ a b IASTではḷと表記される。
- ^ a b IASTではṝと表記される。
- ^ a b IASTではḹと表記される。
- ^ Shashank Shenoy Basty (2021年6月29日). “Proposal to Encode Kannada Sign Combining Anusvara Above Right” (英語). Unicode. 2024年7月31日閲覧。
- ^ "The Unicode Standard, Version 15.1 - U0B80.pdf" (PDF). The Unicode Standard (英語). 2024年7月28日閲覧。