본문 바로가기

컴퓨터 과학 & 영상처리 관련/Python

파이썬 문자열 메쏘드

대소문자 변환
upper(), lower() - 대소문자 변환
capitalize() - 첫 문자를 대문자로




검색관련
coutn(s) - 문자열 s가 몇 번 발생?
find(s), rfind(s) - s위치, 없으면 -1
index(s) - s위치, 없으면 예외 ValueError발생


 



문자열 편집 및 치환
strip(), lstrip(), rstrip() - 좌우 공백 없앰(좌우다, 좌,우)
replace(a,b) - a를 b로 바꾼다
expandtabs() - 탭을 공백 문자로 바꾼다


분리와 결합
split() - 문자열 분리
join() - 문자열 결합



정렬(alignment)
center(), ljust(), rjust() 


 문자열 질의
isalnum() 알파뉴메릭?, isalpha(),isdigit(),islower(),isspace(),istitle(),isupper()



예제 1 : 문자열 붙이기1   (이 코드는 시간이 존나 많이 걸린다)
s = ''
for k in range(100000): 
       s += 'spam'           s는 100000개의 스펨을 갖게된다

예제 1 : 문자열 붙이기2   (다른 방법...좀 낫다함)
t = []
for k in range(100000):
     t.append('spam') 
s = ''.join(t)

  


string 모듈

모듈 상수
 digits, octdigits, hexdigits, letters, lowercase, uppercase, punctuation, printable, whitespace

모듈 함수
대부분은 문자열 메쏘드와 동일
capwords(s) - 각 단어의 첫 문자를 대문자로
zfill(s,n) - 왼쪽의 빈자리를 0으로 채운다
 



유니코드
-유니코드 문자열
http://sourceforge.net/projects/koco
KoreanCodecs-2.0.2.win32-py2.2.exe
 
유니코드는 u...\u로 표현이 가능하다

 >>> print u'Spam and Egg'

Spam and Egg

>>> print u'Spam \uB610 Egg'

Spam 또 Egg

>>> unicode('한글')
u'\ud55c\uae00'
>>>unicode('한글').encode('euc-kr')
'\xc7\xd1\xb1\xdb'
>>>unicode('한글').encode('utf-8')
'\xed\x95\x9c\xea\xb8\x80'
>>>len(unicode('한글'))
2
 

문서 문자열 (#으로 시작하는 코멘트 말고 다른게 파이썬에 존재함)

-모듈이나 함수, 메쏘드를 해설하는 문서 문자열 
-문서 문자열의 참조
    __doc__ 속성
    좀 더 자세한 설명을 보려면 help를 이용
       -형식화해서 표시
       -하위 함수나 클래스의 문서 문자열도 표시
    문서 문자열 만들기
       -모듈 - 파일의 첫 문자열
       -함수 - 함수의 첫 문자열
       -클래스, 메써드...등도 마찬가지임