이번 포스팅에서는 파이썬 문자열의 내장함수에 대해 알아보도록 하겠습니다.
판다스 Series의 str 접근자를 사용해서 사용할 수 있는 문자열 관련 메서드들과 관계가 있는 만큼 디테일하게 정리해보겠습니다.
find
tmp = 'apple'
print(tmp.find('l')) # 3
print(tmp.find('z')) # -1
찾고자 하는 문자가 문자열에서 처음으로 등장하는 인덱스를 리턴합니다.
해당 문자가 존재하지 않으면 -1을 리턴합니다.
index
tmp = 'orange'
print(tmp.index('r')) # 1
print(tmp.index('z')) # ValueError: substring not found
find 함수와 마찬가지로 찾고자 하는 문자가 위치한 인덱스를 리턴합니다.
하지만 해당 문자를 찾지 못하면 ValueError가 발생합니다.
join
myName = 'Jason'
print(','.join(myName))
# J,a,s,o,n
print(','.join(['J', 'a', 's', 'o', 'n']))
# J,a,s,o,n
이터러블 객체를 구성하는 문자(열)들을 하나로 합친 문자열을 리턴합니다.
upper, lower
myCar = 'bmw'
print(myCar.upper()) # BMW
print(myCar) # bmw, 원본 문자열은 변경 X
yourCar = 'TESLA'
print(yourCar.lower()) # tesla
print(yourCar) # TESLA, 원본 문자열은 변경 X
upper/lower 함수는 문자열을 각각 대문자/소문자로 변환합니다.
단, 원본 문자열은 변경되지 않습니다.
capitalize
greeting = 'merry christmas!'
print(greeting.capitalize())
# Merry christmas!
print(greeting)
# merry christmas!
문자열의 첫번째 문자는 대문자로, 나머지 문자들은 소문자로 변환합니다.
단, 원본 문자열은 변경되지 않습니다.
strip, lstrip, rstrip
myCar = ' BMW'
print(myCar.lstrip())
# 'BMW'
print(myCar)
# ' BMW'
yourCar = 'VOLVO '
print(yourCar.rstrip())
# 'VOLVO'
hisCar = ' TESLA '
print(hisCar.strip())
# 'TESLA'
strip 함수는 디폴트로 문자열의 양끝 공백을 제거합니다.
lstrip, rstrip 함수는 각각 디폴트로 문자열의 왼쪽, 오른쪽 공백을 제거한 뒤 리턴합니다.
별도의 인자를 전달하면 특정 문자를 제거합니다.
단, 원본 문자열은 변경되지 않습니다.
split
me = 'Jason is tired'
meList = me.split()
print(meList)
# ['Jason', 'is', 'tired']
you = 'Harriet is also, tired'
youList = you.split(',')
print(youList)
# ['Harriet is also', ' tired']
특정 문자를 기준으로 문자열을 분리합니다.
인자를 전달하지 않으면 공백을 기준으로 문자열을 분리합니다.
단, 원본 문자열은 변경되지 않습니다.
startswith, endswith
tmp = 'Tesla Eletric Car'
print(tmp.startswith('Tes')) # True
print(tmp.endswith('Car')) # True
startswith, endswith 함수는 문자열이 각각 특정 문자로 시작하거나 끝나면 True를 리턴합니다.
그렇지 않은 경우에는 False를 리턴합니다.
마치며
이상으로 파이썬 문자열 내장함수에 대한 정리를 마치도록 하겠습니다.
다음 포스팅에서는 파이썬의 또 다른 자료구조인 딕셔너리의 내장함수에 대해 알아보도록 하겠습니다.
'파이썬・ML' 카테고리의 다른 글
CountVectorizer, TfidfVectorizer의 min_df와 max_df 매개변수 이해하기 (0) | 2023.09.01 |
---|---|
[ML]mlxtend 모듈로 결정 경계 확인하기 (0) | 2023.08.16 |
파이썬 딕셔너리 함수 총정리 (0) | 2023.07.26 |
파이썬 collections 모듈 Counter 사용하기 (0) | 2023.07.26 |
Selenium 사용하기 (0) | 2023.07.07 |