UTF-8 인코딩, 무엇인가?

UTF-8(Unicode Transformation Format – 8bit) 인코딩은 유니코드 문자를 표현하기 위한 인코딩 방식입니다. 현재 가장 널리 쓰이는 방식입니다. UTF-8 인코딩은 가변 길이 인코딩으로, 1개 문자당 최소 1바이트에서 최대 4바이트(이론상 6바이트)까지의 길이를 갖습니다. 또한, UTF-16과는 달리 바이트 순서의 차이(Big Endian vs Little Endian)로 인한 혼란이 없다는 장점이 있고, 아스키(ASCII) 코드와의 호환성을 갖추고 있습니다. UTF-8에서 1바이트로 표현될 수 … “UTF-8 인코딩, 무엇인가?” 더 읽기

아스키(ASCII) 코드표

본 포스트는 아스키 코드표를 게시합니다. 미국정보교환표준부호(American Standard Code for Information Interchange), 약칭 ‘아스키'(ASCII) 코드는 1967년 미국표준협회(ASA)에서 제정하여 현재도 널리 쓰이고 있는 표준 문자 코드 규격입니다. 아스키 코드 규격은 7비트로 이루어져 있으며, 128개의 코드 중 제어 문자에 33개, 일반 문자에 나머지 95개의 코드가 배당되어 있습니다. 제어 문자는 0x00-0x1F 영역과 0x7F에 배당되어 있고 일반 문자는 0x20-0x7E 영역에 … “아스키(ASCII) 코드표” 더 읽기