Format&Encrypt
11. (Format/Encryption) [포맷] : [UTF-8] 유니코드 인코딩 설명
투케이2K
2025. 2. 3. 18:58
[구 분]
TITLE : DATA FORMAT
FORMAT : UTF-8
[설 명]
--------------------------------------------------------------------------------------
[설 명]
--------------------------------------------------------------------------------------
- 주제 : Format / Encryption
- 제목 : [UTF-8] 유니코드 인코딩 설명
--------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------
[내 용]
--------------------------------------------------------------------------------------
1. UTF-8 은 가장 많이 사용되는 가변 길이 유니코드 인코딩입니다
2. UTF-8 은 켄 톰슨과 롭 파이크 (Go 언어를 만든 사람) 에 의해 만들어 졌으며, 이름은 Unicode Transformation Format – 8-bit 에서 유래되었습니다
3. UTF-8 은 1~4개의 1 바이트 (8비트) 코드 단위 의 가변 너비 인코딩을 사용하여 1,112,064 개의 모든 유효 유니코드 스칼라 값을 인코딩할 수 있습니다
>> UTF-8 은 문자를 나타내기 위한 기본 단위는 1 byte 이며 최대 4 byte 까지 사용할 수 있습니다
>> 아스키 코드 영문, 숫자 등은 1 byte 사용, 유니코드 한글, 한자 등은 3 byte 를 사용합니다
4. UTF-8 유니코드의 처음 128자는 ASCII (아스키)와 동일한 이진 값을 갖는 단일 바이트를 사용하여 인코딩됩니다
5. UTF-8 은 인터넷상의 모든 국가/언어에서 널리 사용되고 있으며, 전 세계적으로 평균 99%가 사용하고, 대부분의 표준에서 사용되고 있습니다
6. UTF-8 표현 성질 :
>> 1바이트로 표시된 문자의 최상위 비트는 항상 0이다.
>> 2바이트 이상으로 표시된 문자의 경우, 첫 바이트의 상위 비트들이 그 문자를 표시하는 데 필요한 바이트 수를 결정한다.
- 예를 들어서 2바이트는 110으로 시작하고, 3바이트는 1110으로 시작한다.
>> 첫 바이트가 아닌 나머지 바이트들은 상위 2비트가 항상 10이다.
7. UTF-8 변환 예시 :
First code point | Last code point | Byte 1 | Byte 2 | Byte 3 | Byte 4
-----------------------------------------------------------------------
U+0000 U+007F 0yyyzzzz
U+0080 U+07FF 110xxxyy 10yyzzzz
U+0800 U+FFFF 1110wwww 10xxxxyy 10yyzzzz
U+010000 U+10FFFF 11110uvv 10vvwwww 10xxxxyy 10yyzzzz
--------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------
[참고 사이트]
--------------------------------------------------------------------------------------
[나무 위키 : UTF-8 설명]
https://namu.wiki/w/UTF-8
[위키 피디아 : UTF-8 설명]
https://en.wikipedia.org/wiki/UTF-8
[온라인 데이터 포맷 사이트]
https://dencode.com/
--------------------------------------------------------------------------------------
반응형