유니코드 한글 완성자 코드표

※이 포스트는 11,172자의 한글 완성자를 모두 수록하여 스크롤 압박이 있습니다. 유니코드에서 한글 완성자는 U+AC00 – U+D7A3 범위 내에 11,172자가 배당되어 있습니다. 한글 자체는 유니코드 초창기부터 추가되었지만, 지금과 같은 순서는 유니코드 2.0 버전부터 확립되었습니다. 초기 버전인 1.0.0에서는 KS X 1001 완성형의 2,350자가 U+3400 – U+3D2D 범위에 추가되었고, 그 다음 1.1 버전에서는 U+3D2E – U+44B7 범위에 1,930자와 … “유니코드 한글 완성자 코드표” 더 읽기

조합형 한글 코드에 대한 설명

한글 조합형은 삼보컴퓨터가 주도한 개방적 산업 규격으로, DOS 시절 많이 쓰였던 한글 인코딩 방식입니다. 완성형과 동일하게 2바이트 인코딩이지만, 현대 한글 11,272자를 모두 표현이 가능하며 한글 완성자와 코드 사이에 일관성이 있습니다. (완성형은 2,350자만 표현이 가능하며, 자주 쓰이는 글자들만 수록하다 보니 한글 완성자와 코드 사이에 일관성이 없습니다.) 조합형 한글 코드는 2바이트에서 맨 첫 비트를 1로 하여 한글임을 … “조합형 한글 코드에 대한 설명” 더 읽기

KS X 1001 완성형 한글 코드표

KS X 1001 완성형 한글 코드의 한글 완성자는 2,350자로 이루어져 있으며, 다음 조건을 만족합니다. 첫 바이트는 0xB0 – 0xC8 범위 안에 있습니다. 후속 바이트는 0xA1 – 0xFE 범위 안에 있습니다. 이 조건을 만족하는 한글 완성자 코드표는 다음과 같습니다. 0x 0 1 2 3 4 5 6 7 8 9 A B C D E F … “KS X 1001 완성형 한글 코드표” 더 읽기

한글 완성자 분석하는 파이썬 코드

한글날에 한 포스트 작성합니다. 이 포스트는 파이썬에서 한글 완성자를 분석하는 포스트입니다. 유니코드에서 한글 완성자는 ‘가’부터 ‘힣’까지 모두 11172자가 있으며 ‘가’는 0xAC00(Dec 44032)에, ‘힣’은 0xD7A3(Dec 55203)에 배당되어 있습니다. 그리고 이는 과거에 널리 사용되었던 완성형(KS X 1001)과는 달리 DOS 시절 많이 쓰였던 조합형 코드처럼 오늘날의 한글 맞춤법 체계에서 조합 가능한 모든 글자들이 규칙적으로 배열되어 있다는 특징이 있습니다. … “한글 완성자 분석하는 파이썬 코드” 더 읽기