カンナダ文字 (Unicodeのブロック)

カンナダ文字(カンナダもじ、英語: Kannada)は、Unicodeの30個目のブロック

カンナダ文字 (Unicodeのブロック)
Kannada
範囲 U+0C80..U+0CFF
(128 個の符号位置)
基本多言語面
用字 カンナダ文字
主な言語・文字体系
割当済 89 個の符号位置
未使用 39 個の保留
Unicodeのバージョン履歴
1.0.0 78 (+78)
4.0 80 (+2)
5.0 84 (+4)
7.0 85 (+1)
9.0 86 (+1)
11.0 87 (+1)
14.0 88 (+1)
15.0 89 (+1)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

解説

編集

インド南西部のカルナータカ州で話されているドラヴィダ語族カンナダ語トゥル語を表記するためのカンナダ文字を収録している。

カンナダ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(カンナダ数字)を有している。

Unicodeのバージョン1.0においても「カンナダ文字(Kannada)」というブロック名で制定されていた[1]

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0C80 KANNADA SIGN SPACING CANDRABINDU
U+0C81 KANNADA SIGN CANDRABINDU アヌナーシカ、或いはチャンドラビンドゥ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+0C82 KANNADA SIGN ANUSVARA アヌスヴァーラ、或いはビンドゥ。

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

コンカニ語ハヴィヤカ・カンナダ語英語版(ハヴィガンナダ語)、およびアワディー語において通常のアヌスヴァーラを示すのに用いられる。[2]

U+0C83 KANNADA SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

U+0C84 KANNADA SIGN SIDDHAM テキストの冒頭で祈りの言葉(invocation)として使用される。
独立母音字
U+0C85 KANNADA LETTER A 短母音[ʌ]を表す。 a
U+0C86 KANNADA LETTER AA 長母音[ɑː]を表す。 ā
U+0C87 KANNADA LETTER I 短母音[ɪ]を表す。 i
U+0C88 KANNADA LETTER II 長母音[iː]を表す。 ī
U+0C89 KANNADA LETTER U 短母音[ʊ]を表す。 u
U+0C8A KANNADA LETTER UU 長母音[uː]を表す。 ū
U+0C8B KANNADA LETTER VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現在のカンナダ語では[ru]と発音される。

[3]
U+0C8C KANNADA LETTER VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。

現在のカンナダ語では[ɭu]と発音される。

[4]
U+0C8D (予約済) ê
U+0C8E KANNADA LETTER E 短母音[e]を表す。 e
U+0C8F KANNADA LETTER EE 長母音[eː]を表す。 ē
U+0C90 KANNADA LETTER AI 二重母音[aɪ]を表す。 ai
U+0C91 (予約済) ô
U+0C92 KANNADA LETTER O 短母音[o]を表す。 o
U+0C93 KANNADA LETTER OO 長母音[oː]を表す。 ō
U+0C94 KANNADA LETTER AU 二重母音[aʊ]を表す。 au
子音字
U+0C95 KANNADA LETTER KA 子音[k]を表す。 k
U+0C96 KANNADA LETTER KHA 子音[kʰ]を表す。 kh
U+0C97 KANNADA LETTER GA 子音[ɡ]を表す。 g
U+0C98 KANNADA LETTER GHA 子音[ɡʱ]を表す。 gh
U+0C99 KANNADA LETTER NGA 子音[ŋ]を表す。
U+0C9A KANNADA LETTER CA 子音[c]を表す。 c
U+0C9B KANNADA LETTER CHA 子音[cʰ]を表す。 ch
U+0C9C KANNADA LETTER JA 子音[ɟ]を表す。 j
U+0C9D KANNADA LETTER JHA 子音[ɟʱ]を表す。 jh
U+0C9E KANNADA LETTER NYA 子音[ɲ]を表す。 ñ
U+0C9F KANNADA LETTER TTA 子音[ʈ]を表す。
U+0CA0 KANNADA LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+0CA1 KANNADA LETTER DDA 子音[ɖ]を表す。
U+0CA2 KANNADA LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+0CA3 KANNADA LETTER NNA 子音[ɳ]を表す。
U+0CA4 KANNADA LETTER TA 子音[t]を表す。 t
U+0CA5 KANNADA LETTER THA 子音[tʰ]を表す。 th
U+0CA6 KANNADA LETTER DA 子音[d]を表す。 d
U+0CA7 KANNADA LETTER DHA 子音[dʱ]を表す。 dh
U+0CA8 KANNADA LETTER NA 子音[n]を表す。 n
U+0CA9 (予約済)
U+0CAA KANNADA LETTER PA 子音[p]を表す。 p
U+0CAB KANNADA LETTER PHA 子音[pʰ]を表す。 ph
U+0CAC KANNADA LETTER BA 子音[b]を表す。 b
U+0CAD KANNADA LETTER BHA 子音[bʱ]を表す。 bh
U+0CAE KANNADA LETTER MA 子音[m]を表す。 m
U+0CAF KANNADA LETTER YA 子音[j]を表す。 y
U+0CB0 KANNADA LETTER RA 子音[r]を表す。 r
U+0CB1 KANNADA LETTER RRA 子音[ɽ]を表す。
U+0CB2 KANNADA LETTER LA 子音[l]を表す。 l
U+0CB3 KANNADA LETTER LLA 子音[ɭ]を表す。
U+0CB4 (予約済)
U+0CB5 KANNADA LETTER VA 子音[ʋ]を表す。 v
U+0CB6 KANNADA LETTER SHA 子音[ɕ]を表す。 ś
U+0CB7 KANNADA LETTER SSA 子音[ɕ]を表す。

元々は反り舌音の[ʂ]を表していた。

U+0CB8 KANNADA LETTER SA 子音[s]を表す。 s
U+0CB9 KANNADA LETTER HA 子音[h]を表す。 h
各種記号
U+0CBC KANNADA SIGN NUKTA ヌクター。子音字を拡張して新たな発音を表す際に用いられる。
U+0CBD KANNADA SIGN AVAGRAHA アヴァグラハ。連音サンディ)によって語頭の母音 a が消えたことを表す。
従属母音記号
U+0CBE KANNADA VOWEL SIGN AA 長母音[ɑː]を表す。 ā
U+0CBF ಿ KANNADA VOWEL SIGN I 短母音[ɪ]を表す。 i
U+0CC0 KANNADA VOWEL SIGN II 長母音[iː]を表す。 ī
U+0CC1 KANNADA VOWEL SIGN U 短母音[ʊ]を表す。 u
U+0CC2 KANNADA VOWEL SIGN UU 長母音[uː]を表す。 ū
U+0CC3 KANNADA VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現代のカンナダ語では[ru]と発音される。

[3]
U+0CC4 KANNADA VOWEL SIGN VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のカンナダ語では[ruː]と発音される。

r̥̄[5]
U+0CC5 (予約済) ê
U+0CC6 KANNADA VOWEL SIGN E 短母音[e]を表す。 e
U+0CC7 KANNADA VOWEL SIGN EE 長母音[eː]を表す。 ē
U+0CC8 KANNADA VOWEL SIGN AI 二重母音[aɪ]を表す。 ai
U+0CC9 (予約済) ô
U+0CCA KANNADA VOWEL SIGN O 短母音[o]を表す。 o
U+0CCB KANNADA VOWEL SIGN OO 長母音[oː]を表す。 ō
U+0CCC KANNADA VOWEL SIGN AU 二重母音[aʊ]を表す。 au
ヴィラーマ
U+0CCD KANNADA SIGN VIRAMA ハラント(halant)[2]、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にハラント記号が子音字の上に書かれることもある。

各種記号
U+0CD5 KANNADA LENGTH MARK
U+0CD6 KANNADA AI LENGTH MARK
追加の子音字
U+0CDD KANNADA LETTER NAKAARA POLLU 随伴母音/-a/を伴わない子音[n]を表す。[2]
U+0CDE KANNADA LETTER FA 子音[ɻ]を表していた。現在は使用されていない。[2]

なお、文字名が"FA"となっているが、これは"LLLA"の誤りである。[2]

サンスクリット語用の追加母音字
U+0CE0 KANNADA LETTER VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のカンナダ語では[ruː]と発音される。

r̥̄[5]
U+0CE1 KANNADA LETTER VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。

現在のカンナダ語では[ɭuː]と発音される。

l̥̄[6]
従属母音記号
U+0CE2 KANNADA VOWEL SIGN VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。

現在のカンナダ語では[ɭu]と発音される。

[4]
U+0CE3 KANNADA VOWEL SIGN VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。

現在のカンナダ語では[ɭuː]と発音される。

l̥̄[6]
予約済
U+0CE4 (予約済) .
U+0CE5 (予約済)
数字
U+0CE6 KANNADA DIGIT ZERO カンナダ文字における数字の0 0
U+0CE7 KANNADA DIGIT ONE カンナダ文字における数字の1 1
U+0CE8 KANNADA DIGIT TWO カンナダ文字における数字の2 2
U+0CE9 KANNADA DIGIT THREE カンナダ文字における数字の3 3
U+0CEA KANNADA DIGIT FOUR カンナダ文字における数字の4 4
U+0CEB KANNADA DIGIT FIVE カンナダ文字における数字の5 5
U+0CEC KANNADA DIGIT SIX カンナダ文字における数字の6 6
U+0CED KANNADA DIGIT SEVEN カンナダ文字における数字の7 7
U+0CEE KANNADA DIGIT EIGHT カンナダ文字における数字の8 8
U+0CEF KANNADA DIGIT NINE カンナダ文字における数字の9 9
サンスクリット語において用いられた記号
U+0CF1 KANNADA SIGN JIHVAMULIYA
U+0CF2 KANNADA SIGN UPADHMANIYA
U+0CF3 KANNADA SIGN COMBINING ANUSVARA ABOVE RIGHT コンカニ語ハヴィヤカ・カンナダ語英語版(ハヴィガンナダ語)、およびアワディー語においてアヌナーシカ(anunāsikā、鼻母音化)を示すのに用いられる。[2][7]

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「サンスクリット語において用いられた記号」(Signs used in Sanskrit)の10個となっている[8]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはカンナダ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはカンナダ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはカンナダ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号(Dependent vowel signs

編集

この小分類にはカンナダ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ(Virama

編集

この小分類にはカンナダ文字のうち、ハラント(halant)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。

なお文字名および小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。

追加の子音字(Additional consonants

編集

この小分類にはカンナダ文字のうち、借用語などで用いられる拡張子音字が収録されている。

サンスクリット語用の追加母音字(Additional vowels for Sanskrit

編集

この小分類にはカンナダ文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。

予約済(Reserved

編集

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する[2]

数字(Digits

編集

この小分類にはカンナダ文字で用いられる固有の数字が収録されている。

サンスクリット語において用いられた記号(Signs used in Sanskrit

編集

この小分類にはカンナダ文字のうち、サンスクリット語において用いられた記号3つが収録されている。

文字コード

編集
カンナダ文字(Kannada)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0C8x
U+0C9x
U+0CAx
U+0CBx ಿ
U+0CCx
U+0CDx
U+0CEx
U+0CFx  ೱ   ೲ 
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 78 (to be determined)
4.0 U+0CBC..0CBD 2 (to be determined)
5.0 U+0CE2..0CE3 2 L2/04-364 Michael Everson (21 October 2004), Proposal to add six characters for Kannada to the BMP (WG2 N2860) (英語)
U+0CF1..0CF2 2 L2/04-364 Michael Everson (21 October 2004), Proposal to add six characters for Kannada to the BMP (WG2 N2860) (英語)
L2/13-242 Srinidhi (23 December 2013), Representation of Jihvamuliya and Upadhmaniya in Kannada (英語)
L2/14-066 Shriramana Sharma (6 February 2014), Representation of the Brahmi and Kannada Jihvamuliya/Upadhmaniya Characters in the Code Charts (英語)
7.0 U+0C81 1 (to be determined)
9.0 U+0C80 1 L2/14-153 Vinodh Rajan (18 July 2014), Proposal to encode Kannada Sign Spacing Candrabindu (英語)
L2/14-166 Srinidhi (25 July 2014), Usage of Kannada Sign Spacing Candrabindu in Vedic texts (英語)
L2/14-188 Shriramana Sharma (1 August 2014), Comments on proposal for Kannada Sign Spacing Candrabindu (英語)
L2/15-158 Shriramana Sharma (20 May 2015), Attestations for Sama Vedic usage of 0C80 KANNADA SIGN SPACING CANDRABINDU (英語)
11.0 U+0C84 1 L2/16-031 Srinidhi A; Sridatta A (22 January 2016), Proposal to encode the Kannada sign SIDDHAM in Unicode (英語)
14.0 U+0CDD 1 L2/13-228 Shriramana Sharma (26 November 2013), The Kannada "nakaara-pollu" (英語)
L2/20-228 Srinidhi A; Sridatta A (7 January 2021), Proposal to encode Kannada sign Nakaara Pollu (revised) (英語)
15.0 U+0CF3 1 L2/20-260 Shashank Shenoy Basty (1 October 2020), Preliminary Proposal to Encode Kannada Sign Combining Anusvara Right Top (英語)
L2/21-114 Shashank Shenoy Basty (29 June 2021), Proposal to Encode Kannada Sign Combining Anusvara Above Right (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b c d e f g "The Unicode Standard, Version 15.1 - U0C80.pdf" (PDF). The Unicode Standard (英語). 2024年7月30日閲覧
  3. ^ a b IASTではṛと表記される。
  4. ^ a b IASTではḷと表記される。
  5. ^ a b IASTではṝと表記される。
  6. ^ a b IASTではḹと表記される。
  7. ^ Shashank Shenoy Basty (2021年6月29日). “Proposal to Encode Kannada Sign Combining Anusvara Above Right” (英語). Unicode. 2024年7月31日閲覧。
  8. ^ "The Unicode Standard, Version 15.1 - U0B80.pdf" (PDF). The Unicode Standard (英語). 2024年7月28日閲覧

関連項目

編集