유니코드 문자표 A000-D7FF

유니코드 문자표 중 U+A000부터 U+D7FF까지입니다. U+A000부터 U+DFFF 구간의 문자는 다음과 같습니다. 이 문자 (U+A000 – U+A48F) 이 문자 부수 (U+A490 – U+A4CF) 리수 문자 (U+A4D0 – U+A4FF) 바이 문자 (U+A500 – U+A63F) 키릴 문자 확장 B (U+A640 – U+A69F) 바뭄 문자 (U+A6A0 – U+A6FF) 성조 수식 문자 (U+A700 – U+A71F) 라틴 문자 확장 D (U+A720 … “유니코드 문자표 A000-D7FF” 더 읽기

유니코드 문자표 3000-4DFF

유니코드 문자표 중 U+3000부터 U+4DFF까지입니다. U+3000부터 U+9FFF 구간의 문자는 다음과 같습니다. 한중일 기호 및 구두점 (U+3000 – U+303F) 히라가나 (U+3040 – U+309F) 가타카나 (U+30A0 – U+30FF) 주음 부호 (U+3100 – U+312F) 한글 자모 호환 (U+3130 – U+318F) 한문 훈독 부호 (U+3190 – U+319F) 주음 부호 확장 (U+31A0 – U+31BF) 한자 획 (U+31C0 – U+31EF) 가타카나 … “유니코드 문자표 3000-4DFF” 더 읽기

유니코드 문자표 2000-2FFF

유니코드 문자표 중 U+2000부터 U+2FFF까지입니다. 이 구간의 문자는 다음과 같습니다. 일반 구두점 (U+2000 – U+206F) 위첨자 및 아래첨자 (U+2070 – U+209F) 통화 기호 (U+20A0 – U+20CF) 기호용 조합 분음 부호 (U+20D0 – U+20FF) 글자꼴 기호 (U+2100 – U+214F) 숫자형 부호 (U+2150 – U+218F) 화살표 (U+2190 – U+21FF) 수학 연산자 (U+2200 – U+22FF) 각종 기술 기호 … “유니코드 문자표 2000-2FFF” 더 읽기

유니코드 문자표 1000-1FFF

유니코드 문자표 중 U+1000부터 U+1FFF까지입니다. 이 구간의 문자는 다음과 같습니다. 미얀마 문자 (U+1000 – U+109F) 조지아 문자 (U+10A0 – U+10FF) 한글 자모 (U+1100 – U+11FF) 그으즈 문자 (U+1200 – U+137F) 그으즈 문자 보충 (U+1380 – U+139F) 체로키 문자 (U+13A0 – U+13FF) 캐나다 원주민 문자 (U+1400 – U+167F) 오검 문자 (U+1680 – U+169F) 룬 문자 (U+16A0 … “유니코드 문자표 1000-1FFF” 더 읽기

유니코드 문자표 0080-0FFF

유니코드 문자표 중 U+0080부터 U+0FFF까지입니다. U+0000부터 U+007F까지는 ASCII 문자표와 동일하므로 본 포스트에서는 생략합니다. U+0080부터 U+009F까지는 C1 제어 문자입니다. 코드 문자 설명 80 PAD Padding Character 81 HOP High Octet Preset 82 BPH Break Permitted Here 83 NBH No Break Here 84 IND Index 85 NEL Next Line 86 SSA Start of Selected Area 87 ESA … “유니코드 문자표 0080-0FFF” 더 읽기

유니코드 한글 완성자 코드표

※이 포스트는 11,172자의 한글 완성자를 모두 수록하여 스크롤 압박이 있습니다. 유니코드에서 한글 완성자는 U+AC00 – U+D7A3 범위 내에 11,172자가 배당되어 있습니다. 한글 자체는 유니코드 초창기부터 추가되었지만, 지금과 같은 순서는 유니코드 2.0 버전부터 확립되었습니다. 초기 버전인 1.0.0에서는 KS X 1001 완성형의 2,350자가 U+3400 – U+3D2D 범위에 추가되었고, 그 다음 1.1 버전에서는 U+3D2E – U+44B7 범위에 1,930자와 … “유니코드 한글 완성자 코드표” 더 읽기

유니코드 평면에 대한 설명

유니코드는 ‘평면'(Plane)이라는 개념이 존재합니다. 평면은 유니코드 전체를 논리적으로 나눈 구획이며, 유니코드의 구획 단위 중 가장 큰 단위입니다. 유니코드 포인트에서 하위 2바이트가 하나의 평면을 이루는 단위입니다. 즉 U+0000부터 U+FFFD까지는 0번 평면, U+10000부터 U+1FFFD까지는 1번 평면, U+20000부터 U+2FFFD까지는 2번 평면 식으로 가며, 16번 평면(U+100000 – U+10FFFD)까지 존재합니다. [주: 각 평면이 FFFF가 아닌 FFFD에서 끝나는 이유는, 하위 2바이트 … “유니코드 평면에 대한 설명” 더 읽기

UTF-8 인코딩, 무엇인가?

UTF-8(Unicode Transformation Format – 8bit) 인코딩은 유니코드 문자를 표현하기 위한 인코딩 방식입니다. 현재 가장 널리 쓰이는 방식입니다. UTF-8 인코딩은 가변 길이 인코딩으로, 1개 문자당 최소 1바이트에서 최대 4바이트(이론상 6바이트)까지의 길이를 갖습니다. 또한, UTF-16과는 달리 바이트 순서의 차이(Big Endian vs Little Endian)로 인한 혼란이 없다는 장점이 있고, 아스키(ASCII) 코드와의 호환성을 갖추고 있습니다. UTF-8에서 1바이트로 표현될 수 … “UTF-8 인코딩, 무엇인가?” 더 읽기