ASCII Code
아스키 코드는 미국 국립표준협회(ANSI)에서 제정한 정보 교환용 7비트 문자 인코딩 체계입니다.영문 알파벳 대소문자, 숫자, 특수문자를 포함한 총 128개의 문자에 고유한 숫자 값을 할당하여,컴퓨터가 문자를 인식하고 처리할 수 있도록 만든 규칙입니다. 이 방식은 이후 대부분의 문자 인코딩 방식의 기초가 되었습니다.
하지만 아스키 코드는 영문을 기준으로 설계되었기 때문에,한글이나 일본어, 중국어 등 다른 언어의 문자를 표현할 수 없다는 한계가 있습니다.또한, 아스키 코드는 1바이트(8비트) 중 7비트만 문자 데이터로 사용하고,남은 1비트는 통신 오류 검출을 위한 패리티 비트로 사용하도록 설계되었습니다.
Unicode
유니코드는 전 세계 모든 문자를 일관되게 표현하고 다룰 수 있도록 만든 국제 표준입니다. 과거에는 국가별로 서로 다른 인코딩 방식을 사용했습니다. 이 때문에 같은 문서라도 다른 시스템에서 문자가 깨지는 문제(깨짐 현상)가 자주 발생했습니다. 이러한 문제를 해결하기 위해 등장한 것이 유니코드(Unicode)입니다.
유니코드는 전 세계 모든 문자에 대해 고유한 코드 포인트(Code Point)를 부여하여, 언어와 상관없이 문자를 일관되게 표현할 수 있도록 합니다.
UTF-8
UTF-8은 유니코드를 구현하기 위한 가변 길이 인코딩 방식 중 하나입니다. 문자에 따라 1바이트에서 최대 4바이트까지 사용하여 문자를 표현합니다. 영문자와 숫자(아스키 범위): 1바이트로 한글, 한자, 이모지 등: 2~4바이트로 인코딩 합니다.
오늘날의 웹서비스와 시스템은 주로 UTF-8 방식을 사용합니다.
가변 길이 인코딩(variable-length encoding) : 문자에 따라 필요한 바이트 수가 달라지는 인코딩 방식입니다.
'CS > Network' 카테고리의 다른 글
| [네트워크] 전송계층 (1) | 2025.01.22 |
|---|---|
| [네트워크] 네트워크 계층 (0) | 2025.01.16 |
| [네트워크] 이더넷 과 통신매체 장비 (2) | 2025.01.14 |
| [네트워크] 네트워크 시작하기 (3) | 2024.11.10 |