Python

(Python) 유니코드 변환

Accept 2024. 2. 2. 00:17
ord()
용도: 주어진 단일 문자열(문자)의 유니코드 코드 포인트(정수 값)를 반환
입력: 단일 문자열 (예: 'A', '가')
반환값: 입력된 문자의 유니코드 코드 포인트를 나타내는 정수 (예: ord('A')는 65, ord('가')는 44032)
s = "A"
print(ord(s))

# 결과
65


chr()

용도: 주어진 유니코드 코드 포인트(정수 값)에 해당하는 문자를 반환

입력: 유니코드 코드 포인트를 나타내는 정수 (예: 65, 44032)

반환값: 입력된 유니코드 코드 포인트에 해당하는 문자열 (예: chr(65)는 'A', chr(44032)는 '가')

n = 65
print(chr(n))

# 결과
A​

 

참고사항

아스키코드 (ASCII) - 가장 기본적인 표준화된 문자 인코딩 방식
전체 명칭: American Standard Code for Information Interchange
정의: 아스키코드는 7비트 인코딩 체계로, 128개의 서로 다른 문자를 정의합니다(0에서 127까지). 이에는 영문 알파벳(대소문자), 숫자(0-9), 특수 문자, 그리고 제어 문자가 포함됩니다.
목적: 아스키코드는 초기 컴퓨터 통신과 데이터 교환에서 표준화된 문자 인코딩 방식을 제공하기 위해 개발되었습니다.한계: 아스키코드는 영문 알파벳과 기본적인 특수 문자만을 지원하기 때문에, 다양한 언어와 기호를 사용하는 글로벌 커뮤니케이션에는 적합하지 않습니다.


유니코드 (Unicode) - 다국어 처리를 위한 문자 인코딩 방식
정의: 유니코드는 전 세계의 모든 문자 시스템을 수용할 수 있도록 설계된 국제적인 문자 인코딩 표준입니다. 유니코드는 각 문자에 고유한 코드 포인트를 할당하며, 현재 140,000개 이상의 문자를 지원합니다.
목적: 유니코드는 전 세계의 모든 문자와 기호를 하나의 일관된 시스템 내에서 표현할 수 있게 함으로써, 다국어 처리의 복잡성을 크게 줄이고자 합니다.
인코딩 방식: 유니코드는 여러 인코딩 방식을 지원합니다. 가장 널리 사용되는 인코딩은 UTF-8, UTF-16, 그리고 UTF-32입니다. UTF-8은 인터넷에서 가장 많이 사용되며, ASCII 문자에 대해 완벽하게 하위 호환됩니다.

'Python' 카테고리의 다른 글

(Python) 비트 단위 논리 연산자  (0) 2024.03.10
(Python) 소수 연산  (0) 2024.03.06
(Python) 진수 표기법  (0) 2024.02.01
(Python) 특수 문자 다루기  (0) 2024.02.01
(Python) math  (1) 2024.01.30