Character Encoding(문자열 인코딩)
Last updated
Last updated
처음으로 정립한 표준
영문 알파벳을 사용하는 대표적인 문자 인코딩 방식
대문자, 소문자, 아라비아 숫자, 공백 및 특수 문자
0 ~ 127(총 128자)의 숫자로 문자 표현
2. EUC-KR(CP949)
한글을 표현하기 위한 문자열 인코딩 방식
16bit(2byte) 고정적으로 사용
모든 글자가 완성된 형태로 존재하는 완성형 코드
현재는 UTF-8로 변경 권장
3. Unicode(유니코드)
Universal Character Set(Superset of other encoded character sets)
국제 표준화 기구(ISO)에서 만든 동일한 규칙으로 모든 언어 표현하는 문자열 인코딩 방식
3-1. UTF-8
8bit(1byte)로 인코딩
ASCII 코드와 완벽히 호환. 1 ~ 6byte까지 사용 가능
대부분의 환경에서 호환.
JSON
은 UTF-8 인코딩만 지원
3-2. UTF-16(Multi-Byte)
16bit(일반 문자2byte 또는 특수 문자 4byte)로 인코딩
ASCII 코드와 호환되지 않음
Java, Window 환경에서 호환
3-2. UTF-32
32bit(4byte) 고정적으로 사용
반드시 사용해야 하는 환경 아니면 권장 안함 (HTML5에서는 사용이 금지)