유니코드 한글 완성자 코드표

※이 포스트는 11,172자의 한글 완성자를 모두 수록하여 스크롤 압박이 있습니다. 유니코드에서 한글 완성자는 U+AC00 – U+D7A3 범위 내에 11,172자가 배당되어 있습니다. 한글 자체는 유니코드 초창기부터 추가되었지만, 지금과 같은 순서는 유니코드 2.0 버전부터 확립되었습니다. 초기 버전인 1.0.0에서는 KS X 1001 완성형의 2,350자가 U+3400 – U+3D2D 범위에 추가되었고, 그 다음 1.1 버전에서는 U+3D2E – U+44B7 범위에 1,930자와 … “유니코드 한글 완성자 코드표” 더 읽기

한자 모양 설명 문자, 무엇인가?

한자 모양 설명 문자는 유니코드에서 Ideographic Description Characters(약칭 IDC)라고 부릅니다. 이는 유니코드에서 한자를 ‘한중일 통합 표의문자'(CJK Unified Ideographs)라고 부르기 때문입니다. 한자 모양 설명 문자를 만든 이유는 한자가 표의문자인 특성상 무수히 많은 글자들이 존재하기 때문입니다. 구체적인 사물의 형태를 본떠서 만든 상형자(예: 日, 月), 추상적인 개념을 부호화하여 만든 지사자(예: 一, 上), 복수의 한자를 하나로 조합하여 새로운 의미를 … “한자 모양 설명 문자, 무엇인가?” 더 읽기

조합형 한글 코드에 대한 설명

한글 조합형은 삼보컴퓨터가 주도한 개방적 산업 규격으로, DOS 시절 많이 쓰였던 한글 인코딩 방식입니다. 완성형과 동일하게 2바이트 인코딩이지만, 현대 한글 11,272자를 모두 표현이 가능하며 한글 완성자와 코드 사이에 일관성이 있습니다. (완성형은 2,350자만 표현이 가능하며, 자주 쓰이는 글자들만 수록하다 보니 한글 완성자와 코드 사이에 일관성이 없습니다.) 조합형 한글 코드는 2바이트에서 맨 첫 비트를 1로 하여 한글임을 … “조합형 한글 코드에 대한 설명” 더 읽기

KS X 1001 완성형 한글 코드표

KS X 1001 완성형 한글 코드의 한글 완성자는 2,350자로 이루어져 있으며, 다음 조건을 만족합니다. 첫 바이트는 0xB0 – 0xC8 범위 안에 있습니다. 후속 바이트는 0xA1 – 0xFE 범위 안에 있습니다. 이 조건을 만족하는 한글 완성자 코드표는 다음과 같습니다. 0x 0 1 2 3 4 5 6 7 8 9 A B C D E F … “KS X 1001 완성형 한글 코드표” 더 읽기

유니코드 평면에 대한 설명

유니코드는 ‘평면'(Plane)이라는 개념이 존재합니다. 평면은 유니코드 전체를 논리적으로 나눈 구획이며, 유니코드의 구획 단위 중 가장 큰 단위입니다. 유니코드 포인트에서 하위 2바이트가 하나의 평면을 이루는 단위입니다. 즉 U+0000부터 U+FFFD까지는 0번 평면, U+10000부터 U+1FFFD까지는 1번 평면, U+20000부터 U+2FFFD까지는 2번 평면 식으로 가며, 16번 평면(U+100000 – U+10FFFD)까지 존재합니다. [주: 각 평면이 FFFF가 아닌 FFFD에서 끝나는 이유는, 하위 2바이트 … “유니코드 평면에 대한 설명” 더 읽기

UTF-8 인코딩, 무엇인가?

UTF-8(Unicode Transformation Format – 8bit) 인코딩은 유니코드 문자를 표현하기 위한 인코딩 방식입니다. 현재 가장 널리 쓰이는 방식입니다. UTF-8 인코딩은 가변 길이 인코딩으로, 1개 문자당 최소 1바이트에서 최대 4바이트(이론상 6바이트)까지의 길이를 갖습니다. 또한, UTF-16과는 달리 바이트 순서의 차이(Big Endian vs Little Endian)로 인한 혼란이 없다는 장점이 있고, 아스키(ASCII) 코드와의 호환성을 갖추고 있습니다. UTF-8에서 1바이트로 표현될 수 … “UTF-8 인코딩, 무엇인가?” 더 읽기

아스키(ASCII) 코드표

본 포스트는 아스키 코드표를 게시합니다. 미국정보교환표준부호(American Standard Code for Information Interchange), 약칭 ‘아스키'(ASCII) 코드는 1967년 미국표준협회(ASA)에서 제정하여 현재도 널리 쓰이고 있는 표준 문자 코드 규격입니다. 아스키 코드 규격은 7비트로 이루어져 있으며, 128개의 코드 중 제어 문자에 33개, 일반 문자에 나머지 95개의 코드가 배당되어 있습니다. 제어 문자는 0x00-0x1F 영역과 0x7F에 배당되어 있고 일반 문자는 0x20-0x7E 영역에 … “아스키(ASCII) 코드표” 더 읽기