ラテン1補助

ユニコードのブロック。

ラテン1補助 (ラテン1ほじょ、英語: Latin-1 Supplement) Unicodeの2つ目のブロックである。C1制御文字及びラテン1補助(C1 Controls and Latin-1 Supplement)とも呼ばれる。 ISO/IEC 8859-1の 80 (U+0080) - FF (U+00FF) までが収録されている。 C1制御文字英語版 (0080–009F)は画面表示されない。このブロックは U+0080 から U+00FFまでの範囲内にC1制御文字、句読点や記号、アクセント付きのアルファベット、および数学演算子など128文字が収録されている。

ラテン1補助
範囲 U+0080..U+00FF
(128 個の符号位置)
基本多言語面
用字 ラテン文字 (64文字)
Common (64文字)
記号集合 約物
数学記号
通貨記号
主な言語・文字体系 フランス語
ドイツ語
アイスランド語
スペイン語
割当済 128 個の符号位置
33 個の制御文字または書式文字
未使用 0 個の保留
元となった標準規格 ISO/IEC 8859-1
Unicodeのバージョン履歴
1.0.0 128 (+128)
公式ページ
コード表 ∣ ウェブページ
備考: [1][2]
テンプレートを表示

ラテン1補助ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[3]

収録文字

編集
コード 文字 文字名(英語) 説明 略号
C1制御文字
U+0080 Padding Character PAD
U+0081 High Octet Preset HOP
U+0082 Break Permitted Here BPH
U+0083 No Break Here NBH
U+0084 Index IND
U+0085 Next Line NEL
U+0086 Start of Selected Area SSA
U+0087 End of Selected Area ESA
U+0088 Character (Horizontal) Tabulation Set HTS
U+0089 Character (Horizontal) Tabulation with Justification HTJ
U+008A Line (Vertical) Tabulation Set LTS
U+008B Partial Line Forward (Down) PLD
U+008C Partial Line Backward (Up) PLU
U+008D Reverse Line Feed (Index) RI
U+008E Single-Shift Two SS2
U+008F Single-Shift Three SS3
U+0090 Device Control String DCS
U+0091 Private Use 1 PU1
U+0092 Private Use 2 PU2
U+0093 Set Transmit State STS
U+0094 Cancel character CCH
U+0095 Message Waiting MW
U+0096 Start of Protected Area SPA
U+0097 End of Protected Area EPA
U+0098 Start of String SOS
U+0099 Single Graphic Character Introducer SGCI
U+009A Single Character Introducer SCI
U+009B Control Sequence Introducer CSI
U+009C String Terminator ST
U+009D Operating System Command OSC
U+009E Private Message PM
U+009F Application Program Command APC
ラテン1句読点と記号
U+00A0   Non-breaking space ノーブレークスペース
  • この文字の位置で改行を許可しないスペース
NBSP
U+00A1 ¡ Inverted Exclamation Mark 逆感嘆符
U+00A2 ¢ Cent sign セント記号
U+00A3 £ Pound sign ポンド記号
U+00A4 ¤ Currency sign 不特定通貨記号
  • 通貨記号に対応する文字が表示できない場合や、不明の通貨単位などに代替として用いられる記号。
U+00A5 ¥ Yen sign 円記号
U+00A6 ¦ Broken bar 破断線
U+00A7 § Section sign 節記号
  • 長い文章において、の始まりを表す記号。
U+00A8 ¨ Diaeresis ウムラウト
U+00A9 © Copyright sign 著作権表示記号
U+00AA ª Feminine Ordinal Indicator 女性序数標識
U+00AB « Left-pointing double angle quotation mark 始め二重山括弧引用記号
U+00AC ¬ Not sign 否定
U+00AD Soft hyphen ソフトハイフン
  • 単語が途中で改行される場合、ハイフンを挿入する適切な箇所を明示するための制御文字
SHY
U+00AE ® Registered sign 登録商標記号
U+00AF ¯ macron マクロン
  • U+203E ‾ overlineとは異なり、この文字同士が隣接しても線は繋がらない[4]
  • メキシコ先住民族が話すオスマシン・チナンテク語英語版では低平調を表す。
  • プログラミング言語のAPLでは負の数を表すマイナス記号として用いられる。APLにおいては通常のマイナス記号が配列などを-1倍する演算子として別の機能を持っているため、単なる負値を表現するためにこの記号が使われる[5]
U+00B0 ° Degree symbol
  • 角度を表す。
  • 後ろに任意のラテン文字を伴って様々な体系の温度を表す。
U+00B1 ± Plus-minus sign 正又は負符号(プラスマイナス記号)
  • 複号。数学において符号のみが異なる二つの式を同時に表現する際に用いられる。
  • 統計学測量、製品の規格などにおいて誤差範囲を表す。
  • 占星術では2/5アスペクト(biquintile)、天体同士の角度が144°であることを表す[4]
  • チェス代数式記譜法英語版では白が明らかに有利であることを表す。
U+00B2 ² Superscript two 上付き2
  • 単位に付いて二乗(平方)を表す。
U+00B3 ³ Superscript three 上付き3
  • 単位に付いて三乗(立方)を表す。
U+00B4 ´ Acute accent アキュート・アクセント
U+00B5 µ Micro sign マイクロ
  • 単位に付いて10-6を表す。
U+00B6 Pilcrow sign 段落記号
U+00B7 · Middle dot 中点(ラテン)

なお、乗算や内積を表す数学記号としての用途はU+22C5 ⋅ dot operatorを使うことが推奨されている[4]

U+00B8 ¸ Cedilla セディラ
U+00B9 ¹ Superscript one 上付き1
U+00BA º Masculine ordinal indicator 男性序数標識
  • スペイン語、ポルトガル語、ガリシア語、イタリア語において、数字の後に置かれて男性名詞を修飾する序数詞を表す。
U+00BB » Right-pointing double-angle quotation mark 終わり二重山括弧引用記号
  • フランス語、ポーランド語、ロシア語において用いられる終端側の引用符。
  • デンマーク語の新聞記事や、稀にドイツ語では開始側の引用符として用いられる。
U+00BC ¼ Vulgar fraction one quarter 4分の1
  • 以下の分数に含まれるバーは水平或いは斜めに描画される。その他の分数文字については、2150-215E を参照すること[4]
U+00BD ½ Vulgar fraction one half 2分の1
U+00BE ¾ Vulgar fraction three quarters 4分の3
U+00BF ¿ Inverted Question Mark 逆疑問符
  • スペイン語において疑問文の開始を表す。
文字
U+00C0 À Latin Capital Letter A with grave グレーブアクセント付きA

フランス語ポルトガル語イタリア語カタルーニャ語フリウリ語中国語拼音ベトナム語ウェールズ語スコットランド・ゲール語など。

U+00C1 Á Latin Capital letter A with acute アキュートアクセント付きA

スペイン語ポルトガル語オランダ語チェコ語スロバキア語アイスランド語フェロー語アイルランド語中国語拼音ベトナム語ウェールズ語など。

U+00C2 Â Latin Capital letter A with circumflex サーカムフレックスアクセント付きA

フランス語ポルトガル語フリウリ語ルーマニア語ベトナム語ウェールズ語マドゥラ語など。

U+00C3 Ã Latin Capital letter A with tilde チルド付きA

ポルトガル語ベトナム語など。

U+00C4 Ä Latin Capital letter A with diaeresis ダイエレシス付きA

フランス語ドイツ語オランダ語スウェーデン語フィンランド語エストニア語ルクセンブルク語トルクメン語など。

U+00C5 Å Latin Capital letter A with ring above 上リング付きA

スウェーデン語デンマーク語ノルウェー語など。

U+00C6 Æ Latin Capital letter AE AE

デンマーク語ノルウェー語アイスランド語フェロー語古英語など。

U+00C7 Ç Latin Capital letter C with cedilla セディラ付きC

フランス語ポルトガル語カタルーニャ語ガリシア語トルコ語アルバニア語アゼルバイジャン語トルクメン語など。

U+00C8 È Latin Capital letter E with grave グレーブアクセント付きE

フランス語イタリア語カタルーニャ語オランダ語ロマンシュ語フリウリ語中国語拼音ベトナム語スコットランド・ゲール語ジャワ語マドゥラ語など。

U+00C9 É Latin Capital letter E with acute アキュートアクセント付きE

フランス語スペイン語ポルトガル語カタルーニャ語オランダ語チェコ語スロバキア語アイスランド語フェロー語アイルランド語ルクセンブルク語ロマンシュ語中国語拼音ベトナム語ジャワ語など。

U+00CA Ê Latin Capital letter E with circumflex サーカムフレックスアクセント付きE

フランス語ポルトガル語ロマンシュ語フリウリ語中国語拼音ベトナム語ウェールズ語など。

U+00CB Ë Latin Capital letter E with diaeresis ダイエレシス付きE

フランス語オランダ語アルバニア語ルクセンブルク語など。

U+00CC Ì Latin Capital letter I with grave グレーブアクセント付きI

イタリア語フリウリ語中国語拼音ベトナム語スコットランド・ゲール語など。

U+00CD Í Latin Capital letter I with acute アキュートアクセント付きI

スペイン語ポルトガル語カタルーニャ語オランダ語チェコ語スロバキア語アイスランド語フェロー語アイルランド語中国語拼音ベトナム語など。

U+00CE Î Latin Capital letter I with circumflex サーカムフレックスアクセント付きI

フランス語ルーマニア語ウェールズ語フリウリ語など。

U+00CF Ï Latin Capital letter I with diaeresis ダイエレシス付きI

フランス語カタルーニャ語オランダ語ウェールズ語など。

U+00D0 Ð Latin Capital letter Eth アイスランド語ETH

アイスランド語フェロー語古英語など。

U+00D1 Ñ Latin Capital letter N with tilde チルド付きN

スペイン語ガリシア語など。

U+00D2 Ò Latin Capital letter O with grave グレーブアクセント付きO

イタリア語カタルーニャ語フリウリ語中国語拼音ベトナム語スコットランド・ゲール語など。

U+00D3 Ó Latin Capital letter O with acute アキュートアクセント付きO

スペイン語ポルトガル語カタルーニャ語オランダ語ポーランド語チェコ語スロバキア語アイスランド語フェロー語アイルランド語中国語拼音ベトナム語など。

U+00D4 Ô Latin Capital letter O with circumflex サーカムフレックスアクセント付きO

フランス語ポルトガル語ウェールズ語フリウリ語ベトナム語など。

U+00D5 Õ Latin Capital letter O with tilde チルド付きO

ポルトガル語エストニア語など。

U+00D6 Ö Latin Capital letter O with diaeresis ダイエレシス付きO

フランス語ドイツ語オランダ語スウェーデン語フィンランド語エストニア語アイスランド語トルコ語アゼルバイジャン語トルクメン語ロマンシュ語など。

数学演算子
U+00D7 × Multiplication sign 乗算記号
文字
U+00D8 Ø Latin Capital letter O with stroke ストローク付きO

デンマーク語ノルウェー語フェロー語など。

U+00D9 Ù Latin Capital letter U with grave グレーブアクセント付きU

フランス語イタリア語フリウリ語中国語拼音ベトナム語スコットランド・ゲール語など。

U+00DA Ú Latin Capital letter U with acute アキュートアクセント付きU

スペイン語ポルトガル語カタルーニャ語オランダ語チェコ語スロバキア語アイスランド語フェロー語アイルランド語中国語拼音ベトナム語など。

U+00DB Û Latin Capital Letter U with circumflex サーカムフレックスアクセント付きU

フランス語ウェールズ語フリウリ語など。

U+00DC Ü Latin Capital Letter U with diaeresis ダイエレシス付きU

フランス語スペイン語ポルトガル語カタルーニャ語ドイツ語オランダ語エストニア語トルコ語アゼルバイジャン語トルクメン語ロマンシュ語など。

U+00DD Ý Latin Capital Letter Y with acute アキュートアクセント付きY

アイスランド語ベトナム語トルクメン語など。

U+00DE Þ Latin Capital Letter Thorn アイスランド語THORN

アイスランド語フェロー語古英語など。

  • ルーン文字U+16A6 ᚦ runic letter thurisaz thurs thornに由来し、現在の英語では"th"という綴りに置き換えられた[4]
U+00DF ß Latin Small Letter sharp S ドイツ語エスツェット
  • ドイツ語で用いられる。ただしスイスドイツ語では使わない[4]
  • 対応する大文字は"SS"或いは俗にU+1E9E ẞである[4]
  • 印刷上、この文字のグリフは、U+017F ſ (長いS)と、U+0073 s或いはU+007A zの古い形式のグリフ(後者は U+0292 ʒ に似ている)のいずれかとの合字に基づいている。現在、両方の形式(ſs、ſz)に互換性がある[4]
U+00E0 à Latin Small Letter A with grave グレーブアクセント付きA小文字
U+00E1 á Latin Small Letter A with acute アキュートアクセント付きA小文字
U+00E2 â Latin Small Letter A with circumflex サーカムフレックスアクセント付きA小文字
U+00E3 ã Latin Small Letter A with tilde チルド付きA小文字
U+00E4 ä Latin Small Letter A with diaeresis ダイエレシス付きA小文字
U+00E5 å Latin Small Letter A with ring above 上リング付きA小文字
U+00E6 æ Latin Small Letter AE AE小文字
U+00E7 ç Latin Small Letter C with cedilla セディラ付きC小文字
U+00E8 è Latin Small Letter E with grave グレーブアクセント付きE小文字
U+00E9 é Latin Small Letter E with acute アキュートアクセント付きE小文字
U+00EA ê Latin Small Letter E with circumflex サーカムフレックスアクセント付きE小文字
U+00EB ë Latin Small Letter E with diaeresis ダイエレシス付きE小文字
U+00EC ì Latin Small Letter I with grave グレーブアクセント付きI小文字
U+00ED í Latin Small Letter I with acute アキュートアクセント付きI小文字
U+00EE î Latin Small Letter I with circumflex サーカムフレックスアクセント付きI小文字
U+00EF ï Latin Small Letter I with diaeresis ダイエレシス付きI小文字
U+00F0 ð Latin Small Letter Eth アイスランド語ETH小文字
U+00F1 ñ Latin Small Letter N with tilde チルド付きN小文字
U+00F2 ò Latin Small Letter O with grave グレーブアクセント付きO小文字
U+00F3 ó Latin Small Letter O with acute アキュートアクセント付きO小文字
U+00F4 ô Latin Small Letter O with circumflex サーカムフレックスアクセント付きO小文字
U+00F5 õ Latin Small Letter O with tilde チルド付きO小文字
U+00F6 ö Latin Small Letter O with diaeresis ダイエレシス付きO小文字
数学演算子
U+00F7 ÷ Division sign 除算記号
  • 主に初等教育において除算(割り算)を表す。地域によっては除算にこの記号を使用しない国も存在する。
  • 文脈によっては、ハイフンの代わりの、より視覚的に区別できる形として時々使用される[4]
  • 歴史的には写本内の疑わしい箇所を示す句読点として使われてきた[4]
文字
U+00F8 ø Latin Small Letter O with stroke ストローク付きO小文字
U+00F9 ù Latin Small Letter U with grave グレーブアクセント付きU小文字
U+00FA ú Latin Small Letter U with acute アキュートアクセント付きU小文字
U+00FB û Latin Small Letter U with circumflex サーカムフレックスアクセント付きU小文字
U+00FC ü Latin Small Letter U with diaeresis ダイエレシス付きU小文字
U+00FD ý Latin Small Letter Y with acute アキュートアクセント付きY小文字
U+00FE þ Latin Small Letter Thorn アイスランド語THORN小文字
U+00FF ÿ Latin Small Letter Y with diaeresis ダイエレシス付きY小文字

フランス語オランダ語ijの代替表記など。

小分類

編集

このブロックには4つの小分類がある[7]

C1制御文字

編集

C1制御文字に含まれる32の制御文字はISO/IEC 8859-1や他の8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429:1992から取られている[7]

ラテン1句読点と記号

編集

この小分類には逆感嘆符や逆疑問符、中黒、通貨記号、発音記号、分数、上付き文字などの記号が含まれている[7]

文字

編集

この小分類には西ヨーロッパで使用されるアクセント付きアルファベットなどが含まれている[7]

数学演算子

編集

この小分類には乗算記号と除算記号が含まれている[7]

文字コード表

編集
ラテン1補助(C1 Controls and Latin-1 Supplement)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+008x  XXX   XXX   BPH   NBH   IND   NEL   SSA   ESA   HTS   HTJ   VTS   PLD   PLU    RI    SS2   SS3 
U+009x  DCS   PU1   PU2   STS   CCH    MW    SPA   EPA   SOS   XXX   SCI   CSI    ST    OSC    PM    APC 
U+00Ax NB
  SP  
¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬  SHY 
­
® ¯
U+00Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
U+00Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
U+00Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
U+00Ex à á â ã ä å æ ç è é ê ë ì í î ï
U+00Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
備考
1.^ Unicode バージョン 11.0 現在

絵文字

編集

ラテン1補助にはU+00A9とU+00AE[8][9]の2文字の絵文字が含まれている。

この2文字に対し2種類の異体字セレクタ、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[10]

Emoji variation sequences
U+ 00A9 00AE
base code point © ®
base+VS15 (text) ©︎ ®︎
base+VS16 (emoji) ©️ ®️

履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 U+0080..00FF 128 (to be determined)
L2/15-050R[b][c] Davis, Mark (2015-01-29), Additional variation selectors for emoji 
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
  2. ^ L2/13-207, L2/14-054, L2/14-063, L2/15-051.html, L2/15-051.txtも参照
  3. ^ 追加の絵文字関連のドキュメントについては、その他の記号及び絵記号歴史節を参照。

関連項目

編集

出典

編集
  1. ^ Unicode character database”. The Unicode Standard. 2016年7月9日閲覧。
  2. ^ Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2016年7月9日閲覧。
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc.. (1991). ISBN 0-201-56788-1 
  4. ^ a b c d e f g h i j k l m n o p q The Unicode Standard, Version 16.0 - U0080.pdf” (英語). The Unicode Consortium. 2024年12月13日閲覧。
  5. ^ TryAPL”. 2024年11月14日閲覧。
  6. ^ Michael Everson (2003年8月24日). “Final proposal for encoding the Glagolitic script” (英語). Unicode. 2024年12月13日閲覧。
  7. ^ a b c d e Unicode 6.2 code charts”. The Unicode Standard. 1 April 2013閲覧。
  8. ^ UTR #51: Unicode Emoji”. Unicode Consortium. 2018年5月21日閲覧。
  9. ^ UCD: Emoji Data for UTR #51”. Unicode Consortium. 2018年5月22日閲覧。
  10. ^ UTS #51 Emoji Variation Sequences”. The Unicode Consortium. 2019年1月12日閲覧。