제목:

유니코드 평면에 대한 설명

날짜: Posted on

유니코드는 ‘평면'(Plane)이라는 개념이 존재합니다. 평면은 유니코드 전체를 논리적으로 나눈 구획이며, 유니코드의 구획 단위 중 가장 큰 단위입니다.
유니코드 포인트에서 하위 2바이트가 하나의 평면을 이루는 단위입니다. 즉 U+0000부터 U+FFFD까지는 0번 평면, U+10000부터 U+1FFFD까지는 1번 평면, U+20000부터 U+2FFFD까지는 2번 평면 식으로 가며, 16번 평면(U+100000 – U+10FFFD)까지 존재합니다.
[주: 각 평면이 FFFF가 아닌 FFFD에서 끝나는 이유는, 하위 2바이트 값이 FFFE이거나 FFFF인 유니코드 포인트를 비문자(Noncharacter)로 지정해 두었기 때문입니다. 또한, U+10FFFD까지 정의된 이유는 UTF-16 인코딩으로 표현 가능한 범위를 고려한 것입니다.]

유니코드 15.1 기준 17개의 평면 중 정의된 평면은 7개(0-3, 14-16)입니다.

아래는 유니코드 평면 일람표입니다.

# 범위 명칭
0 U+0000
U+FFFD
기본 다국어 평면
(Basic Multilingual Plane)
1 U+10000
U+1FFFD
보충 다국어 평면
(Supplementary Multilingual Plane)
2 U+20000
U+2FFFD
보충 표의문자 평면
(Supplementary Ideographic Plane)
3 U+30000
U+3FFFD
3차 표의문자 평면
(Tertiary Ideographic Plane)
4 U+40000
U+4FFFD
정의되지 않음
5 U+50000
U+5FFFD
6 U+60000
U+6FFFD
7 U+70000
U+7FFFD
8 U+80000
U+8FFFD
9 U+90000
U+9FFFD
10 U+A0000
U+AFFFD
11 U+B0000
U+BFFFD
12 U+C0000
U+CFFFD
13 U+D0000
U+DFFFD
14 U+E0000
U+EFFFD
보충 특수목적 평면
(Supplementary Special-purpose Plane)
15 U+F0000
U+FFFFD
보충 사용자 정의 평면 A
(Supplementary Private Use Area-A)
16 U+100000
U+10FFFD
보충 사용자 정의 평면 B
(Supplementary Private Use Area-B)

각 평면에 대한 설명은 다음과 같습니다.

기본 다국어 평면 (BMP)
세계 각국에서 많이 쓰이는 기본적인 문자들이 수록된 평면입니다. 아스키 코드에도 있는 라틴 문자를 포함하여 그리스 문자, 러시아 문자, 아랍 문자, 한글 등이 있으며 한자 문화권에서 많이 쓰이는 한자들과 특수문자, 그림문자 등이 있습니다.
보충 다국어 평면 (SMP)
문자들이 추가로 수록된 평면입니다. 역사적 문자들이나 악보 기호, 놀이 기호 등이 수록되어 있습니다.
보충 표의문자 평면 (SIP)
초기 유니코드에 포함되지 않은 수많은 한자들이 수록되어 있는 평면입니다.
3차 표의문자 평면 (TIP)
추가적인 한자나 한자의 역사적 형태(갑골문, 금문, 소전 등)을 위한 평면입니다. 유니코드 15.1 기준으로는 아직 역사적 한자 형태는 수록되어 있지 않습니다.
보충 특수목적 평면 (SSP)
제어용 특수문자가 수록된 평면입니다.
보충 사용자 정의 평면(SPUA)
기본 다국어 평면의 사용자 정의 영역과 별개로 존재하는 사용자 정의 평면입니다. 2개의 평면이 존재하며, 특정 업체나 사용자별로 할당해서 사용하는 평면입니다. 따라서 다른 소프트웨어나 글꼴 간의 호환성은 보장되지 않습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다