유니코드 한글 완성자 코드표

※이 포스트는 11,172자의 한글 완성자를 모두 수록하여 스크롤 압박이 있습니다. 유니코드에서 한글 완성자는 U+AC00 – U+D7A3 범위 내에 11,172자가 배당되어 있습니다. 한글 자체는 유니코드 초창기부터 추가되었지만, 지금과 같은 순서는 유니코드 2.0 버전부터 확립되었습니다. 초기 버전인 1.0.0에서는 KS X 1001 완성형의 2,350자가 U+3400 – U+3D2D 범위에 추가되었고, 그 다음 1.1 버전에서는 U+3D2E – U+44B7 범위에 1,930자와 … “유니코드 한글 완성자 코드표” 더 읽기

유니코드 평면에 대한 설명

유니코드는 ‘평면'(Plane)이라는 개념이 존재합니다. 평면은 유니코드 전체를 논리적으로 나눈 구획이며, 유니코드의 구획 단위 중 가장 큰 단위입니다. 유니코드 포인트에서 하위 2바이트가 하나의 평면을 이루는 단위입니다. 즉 U+0000부터 U+FFFD까지는 0번 평면, U+10000부터 U+1FFFD까지는 1번 평면, U+20000부터 U+2FFFD까지는 2번 평면 식으로 가며, 16번 평면(U+100000 – U+10FFFD)까지 존재합니다. [주: 각 평면이 FFFF가 아닌 FFFD에서 끝나는 이유는, 하위 2바이트 … “유니코드 평면에 대한 설명” 더 읽기

UTF-8 인코딩, 무엇인가?

UTF-8(Unicode Transformation Format – 8bit) 인코딩은 유니코드 문자를 표현하기 위한 인코딩 방식입니다. 현재 가장 널리 쓰이는 방식입니다. UTF-8 인코딩은 가변 길이 인코딩으로, 1개 문자당 최소 1바이트에서 최대 4바이트(이론상 6바이트)까지의 길이를 갖습니다. 또한, UTF-16과는 달리 바이트 순서의 차이(Big Endian vs Little Endian)로 인한 혼란이 없다는 장점이 있고, 아스키(ASCII) 코드와의 호환성을 갖추고 있습니다. UTF-8에서 1바이트로 표현될 수 … “UTF-8 인코딩, 무엇인가?” 더 읽기