다른 명령
UTF-8과 UTF-16의 차이점
- UTF-8과 UTF-16은 모두 유니코드(Unicode) 문자 인코딩 방식
- 메모리 사용 방식과 호환성 측면에서 차이
차이점
구분 | UTF-8 | UTF-16 |
---|---|---|
인코딩 방식 | 1~4바이트 사용 (문자마다 다름) | 2바이트 또는 4바이트 사용 |
ASCII 문자 크기 | 1바이트 | 2바이트 |
한글/비라틴 문자 크기 | 3바이트 | 2바이트 |
이모지 크기 | 4바이트 | 4바이트 |
파일 크기 효율성 | 영어 등 라틴 문자에서는 효율적 | 비라틴 문자(한글, 중국어)에서는 효율적 |
ASCII와 호환성 | 완벽한 호환성 제공 | 호환되지 않음 |
BOM 필요 여부 | 선택적 | BOM 사용 권장 (엔디언 순서 명시) |
주요 사용 사례 | 웹 콘텐츠(HTML, JSON), 프로그래밍 언어 기본 인코딩 | Windows 운영체제 내부, Java, .NET 환경 |
장점 | 호환성 좋고 범용적 | 비라틴 문자에서 더 효율적 |
단점 | 비라틴 문자에서는 파일 크기 증가 | ASCII 문자 사용 시 비효율적 |