Character Encoding

Character Encoding은 텍스트 데이터들을 이진수로 변환시키는 방법이다.

💡
ASCII (아스키 코드)

American Standard Code for Information Interchange의 약자로 알파벳을 사용하는 대표적인 문자 인코딩이다.

대부분의 문자 인코딩이 ASCII를 기초로 하고 있다.

128개의 문자를 출력가능하다.

현재는 표현해야 할 문자의 수가 너무나도 많아 잘 이용되지 않는 편이다.

💡
Unicode (유니코드)

ASCII 이후 대체 방법으로 가장 많이 이용되는 것이 Unicode이다.

유니코드는 UTF (Unicode Transformation Format) 매핑 방식을 이용한다.

대표적인 것으로는 UTF-8, UTF-16, UTF-32이 있다.

어떤 것을 이용할지는 Byte를 고려해야하는데, 보통은 UTF-8이 많이 이용되는 편이다.