파이썬(Python) - Pandas의 문자함수

컴퓨터/파이썬

파이썬(Python) - Pandas의 문자함수

해피밀세트 2020. 3. 16. 17:39

pandas 의 문자함수

Series변수이름.str.메소드

obj = Series([' hello','world ',' hello world '])
# 시리즈 안에있는 문자 길이 파악 obj.str.len()
# 앞,뒤 공백 제거 obj.str.strip() # 앞,뒤 공백 제거 한뒤 문자 길이 obj.str.strip().str.len()
# 왼쪽 공백 제거 obj.str.lstrip() # 왼쪽 공백 제거 한뒤 문자 길이 obj.str.lstrip().str.len()
# 오른쪽 공백 제거 obj.str.rstrip() # 오른쪽 공백 제거 한뒤 문자 길이 obj.str.rstrip().str.len()
obj = obj.str.strip()
# 소문자로 변경 obj.str.lower() # 대문자로 변경 obj.str.upper()
# 첫글자는 대문자 / 나머지는 소문자로 변경 obj.str.capitalize() # 단어별 첫글자는 대문자 / 나머지는 소문자로 변경obj.str.title() # 소문자 <-> 대문자 로 변경 obj.str.swapcase()
# 문자를 다른 문자로 대체 obj.str.replace('hello','안녕')
# 왼쪽부터 글자를 검색한 후 인덱스 번호를 리턴(없으면 -1) obj.str.find('l') obj.str.find('l',4) # 오른쪽부터 글자를 검색한 후 인덱스 번호를 리턴(없으면 -1) obj.str.rfind('l')
# 찾은 문자를 반환 obj.str.findall('l')
#글자로 시작되는지 여부 파악 obj.str.startswith('h')
#글자로 끝나는지 여부 파악 obj.str.endswith('d')
# 글자가 포함되어 있는지 여부 파악(대소문자 구분함) obj.str.contains('w') obj.str.contains('W') # 대소문자를 구분하지 않고 찾겠다.(기본값은 소문자) obj.str.contains('W', case = False) # regex:정규식 표현을 이용해서 찾겠다. obj.str.contains('h\|w', regex = True)
# 맨 앞부터 같은 패턴인지 여부 파악(대소문자 구분함) obj.str.match('w')
# 빈 부분에 문자값 채우기obj.str.pad(width=15,side='left',fillchar='') # 왼쪽obj.str.pad(width=15,side='right',fillchar='') # 오른쪽
# 글자를 가운데에 맞추고 양 옆에 문자값 채우기obj.str.center(width=15,fillchar='_') # 위치에 정렬하고 남은곳에 문자 채우기obj.str.ljust(width=10,fillchar='_') # lpad obj.str.rjust(width=10,fillchar='_') # rlpad

obj = Series([7,'7','seven','SEVEN','Seven','seven7','칠','칠 7',' ','#7'])
# 문자 또는 숫자로 구성 여부(공백문자가 포함되면 False) obj.str.isalnum()
# 문자로 구성 여부(공백문자가 포함되면 False) obj.str.isalpha()
# 숫자로 구성 여부(공백문자가 포함되면 False) obj.str.isnumeric() # 그냥 숫자는 False obj.str.isdecimal() obj.str.isdigit()
# 소문자로만 구성 여부 obj.str.islower() # 대문자로만 구성 여부 obj.str.isupper() # 첫글자 대문자 /나머지 소문자 구성 여부 obj.str.istitle()
# 공백으로만 구성 여부 obj.str.isspace()
# 지정된 위치 값만 반환 obj.str.get(0)
# 인덱스 사이값만 반환 obj.str.slice(start = 0, stop = 2) obj.str.slice(0,2)
# 인덱스 사이값을 다른 값으로 대체obj.str.slice_replace(start=0, stop=2,repl='77')
obj = Series(['www.python.org','www.naver.com'])
# 입력한 문자를 기준으로 자르기 obj.str.split('.') # 각각의 열로 분리 obj.str.split('.',expand = True)
# 입력한 문자를 기준으로 자르되 입력한 문자도 출력 # 앞부분 / 분리자 / 뒷부분 이렇게 3부분으로 나온다. obj.str.partition('.')

저작자표시 (새창열림)

'컴퓨터 > 파이썬' 카테고리의 다른 글

파이썬(Python) - 날짜 계산 (0)	2020.03.17
파이썬(Python) - Pandas의 날짜함수 (0)	2020.03.16
파이썬(Python) - merge와 join (0)	2020.03.12
파이썬(Python) - Pandas의 그룹함수들 (0)	2020.03.11
파이썬(Python) - null 처리 (0)	2020.03.11

현재글파이썬(Python) - Pandas의 문자함수

Truman Show

딥러닝을 공부하는 블로그입니다.

크롤링, 의료영상, CNN, r, 서울맛집, 딥러닝, 함수, 머신러닝, 인공지능, 오라클, SQL, 맛집, Python, 리눅스, pandas, Oracle, Ai, 코딩, 파이토치, 파이썬,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Truman Show

파이썬(Python) - Pandas의 문자함수

pandas 의 문자함수

'컴퓨터 > 파이썬' 카테고리의 다른 글

'컴퓨터/파이썬'의 다른글

티스토리툴바

파이썬(Python) - Pandas의 문자함수

pandas 의 문자함수

'컴퓨터 > 파이썬' 카테고리의 다른 글

'컴퓨터/파이썬'의 다른글

관련글

티스토리툴바