[Network] ASCII Code, Unicode, UTF-8 간단히

2025. 11. 10. 20:17·CS/Network

ASCII Code

아스키 코드는 미국 국립표준협회(ANSI)에서 제정한 정보 교환용 7비트 문자 인코딩 체계입니다.영문 알파벳 대소문자, 숫자, 특수문자를 포함한 총 128개의 문자에 고유한 숫자 값을 할당하여,컴퓨터가 문자를 인식하고 처리할 수 있도록 만든 규칙입니다. 이 방식은 이후 대부분의 문자 인코딩 방식의 기초가 되었습니다.


하지만 아스키 코드는 영문을 기준으로 설계되었기 때문에,한글이나 일본어, 중국어 등 다른 언어의 문자를 표현할 수 없다는 한계가 있습니다.또한, 아스키 코드는 1바이트(8비트) 중 7비트만 문자 데이터로 사용하고,남은 1비트는 통신 오류 검출을 위한 패리티 비트로 사용하도록 설계되었습니다.

Unicode

유니코드는 전 세계 모든 문자를 일관되게 표현하고 다룰 수 있도록 만든 국제 표준입니다. 과거에는 국가별로 서로 다른 인코딩 방식을 사용했습니다. 이 때문에 같은 문서라도 다른 시스템에서 문자가 깨지는 문제(깨짐 현상)가 자주 발생했습니다. 이러한 문제를 해결하기 위해 등장한 것이 유니코드(Unicode)입니다.
유니코드는 전 세계 모든 문자에 대해 고유한 코드 포인트(Code Point)를 부여하여, 언어와 상관없이 문자를 일관되게 표현할 수 있도록 합니다.

UTF-8

UTF-8은 유니코드를 구현하기 위한 가변 길이 인코딩 방식 중 하나입니다. 문자에 따라 1바이트에서 최대 4바이트까지 사용하여 문자를 표현합니다. 영문자와 숫자(아스키 범위): 1바이트로 한글, 한자, 이모지 등: 2~4바이트로 인코딩 합니다.

오늘날의 웹서비스와 시스템은 주로 UTF-8 방식을 사용합니다.

가변 길이 인코딩(variable-length encoding) : 문자에 따라 필요한 바이트 수가 달라지는 인코딩 방식입니다.

'CS > Network' 카테고리의 다른 글

[네트워크] 전송계층  (1) 2025.01.22
[네트워크] 네트워크 계층  (0) 2025.01.16
[네트워크] 이더넷 과 통신매체 장비  (2) 2025.01.14
[네트워크] 네트워크 시작하기  (3) 2024.11.10
'CS/Network' 카테고리의 다른 글
  • [네트워크] 전송계층
  • [네트워크] 네트워크 계층
  • [네트워크] 이더넷 과 통신매체 장비
  • [네트워크] 네트워크 시작하기
절박한개발자
절박한개발자
깃허브 주소 : https://github.com/Kzerojun
  • 절박한개발자
    절박한개발
    절박한개발자
  • 전체
    오늘
    어제
    • 분류 전체보기 (99)
      • Server (5)
      • 프로젝트 (7)
      • Spring (7)
      • AI (1)
      • JPA (6)
      • JAVA (7)
      • Backend (3)
      • WEB (3)
      • 알고리즘-이론 (6)
      • 알고리즘-문제 (28)
      • CS (24)
        • 데이터베이스 (8)
        • Network (5)
        • OS (10)
        • LINUX (1)
      • 개발면접준비 (1)
      • 기타 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    2
    CPU
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
절박한개발자
[Network] ASCII Code, Unicode, UTF-8 간단히
상단으로

티스토리툴바