한글 조합형은 삼보컴퓨터가 주도한 개방적 산업 규격으로, DOS 시절 많이 쓰였던 한글 인코딩 방식입니다.
완성형과 동일하게 2바이트 인코딩이지만, 현대 한글 11,272자를 모두 표현이 가능하며 한글 완성자와 코드 사이에 일관성이 있습니다. (완성형은 2,350자만 표현이 가능하며, 자주 쓰이는 글자들만 수록하다 보니 한글 완성자와 코드 사이에 일관성이 없습니다.)
조합형 한글 코드는 2바이트에서 맨 첫 비트를 1로 하여 한글임을 나타내고, 나머지 15비트는 5비트씩 쪼개어 앞의 5비트는 초성, 다음 5비트는 중성, 마지막 5비트는 종성으로 합니다.
즉 1 xxxxx yyyyy zzzzz(x 초성, y 중성, z 종성)의 구성이며, 바이트 단위로 쪼개면 1xxxxxyy yyyzzzzz 형식으로 이루어집니다.
조합형 한글의 비트 표는 다음과 같습니다.
비트 | 초성 | 중성 | 종성 | |
---|---|---|---|---|
Dec | Bin | |||
0 | 00000 | |||
1 | 00001 | 채움 | 채움 | |
2 | 00010 | ㄱ | 채움 | ㄱ |
3 | 00011 | ㄲ | ㅏ | ㄲ |
4 | 00100 | ㄴ | ㅐ | ㄳ |
5 | 00101 | ㄷ | ㅑ | ㄴ |
6 | 00110 | ㄸ | ㅒ | ㄵ |
7 | 00111 | ㄹ | ㅓ | ㄶ |
8 | 01000 | ㅁ | ㄷ | |
9 | 01001 | ㅂ | ㄹ | |
10 | 01010 | ㅃ | ㅔ | ㄺ |
11 | 01011 | ㅅ | ㅕ | ㄻ |
12 | 01100 | ㅆ | ㅖ | ㄼ |
13 | 01101 | ㅇ | ㅗ | ㄽ |
14 | 01110 | ㅈ | ㅘ | ㄾ |
15 | 01111 | ㅉ | ㅙ | ㄿ |
16 | 10000 | ㅊ | ㅀ | |
17 | 10001 | ㅋ | ㅁ | |
18 | 10010 | ㅌ | ㅚ | |
19 | 10011 | ㅍ | ㅛ | ㅂ |
20 | 10100 | ㅎ | ㅜ | ㅄ |
21 | 10101 | ㅝ | ㅅ | |
22 | 10110 | ㅞ | ㅆ | |
23 | 10111 | ㅟ | ㅇ | |
24 | 11000 | ㅈ | ||
25 | 11001 | ㅊ | ||
26 | 11010 | ㅠ | ㅋ | |
27 | 11011 | ㅡ | ㅌ | |
28 | 11100 | ㅢ | ㅍ | |
29 | 11101 | ㅣ | ㅎ | |
30 | 11110 | |||
31 | 11111 |
이를테면 ‘가족’이라는 단어를 조합형 코드로 나타내면
- 가 = 1 00010 00011 00001 = 10001000 01100001 = 88 61
- 족 = 1 01110 01101 00010 = 10111001 10100010 = B9 A2
0x88 0x61 0xB9 0xA2로 저장됩니다.