urllib2: 무엇을 받고 있는 거지?

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

관리 메뉴

아미(아름다운미소)

urllib2: 무엇을 받고 있는 거지? 본문

랭귀지/python

urllib2: 무엇을 받고 있는 거지?

유키공 2017. 12. 19. 20:30

HTTP 요청을 전송하면, html이나 이미지 또는 비디오 등등이 돌아온다.

어떤 경우에는 받고 있는 데이터의 유형이 예상대로 인지 점검해야 한다.

받고 있는 문서의 유형을 점검하려면, MIME 유형을 보자 (Content-type) 헤더:

urlfile = urllib2.urlopen('http://www.commentcamarche.net/')
print "Document type is", urlfile.info().getheader("Content-Type","")

이는 다음과 같이 출력된다:

Document type is text/html

경고: 쌍반점 다음에 정보가 있을 수 있다. 예를 들어:

Document type is text/html; charset=iso-8859-1

그래서 언제나 다음과 같이 하면:

print "Document type is", urlfile.info().getheader("Content-Type","").split(';')[0].strip()

오직 "text/html" 부분만 얻을 수 있다.

주목하자. .info()는 또한 다른 HTTP 응답 헤더도 돌려준다:

print "HTTP Response headers:"
print urlfile.info()

다음과 같이 인쇄된다:

Document type is Date: Thu, 23 Mar 2006 15:13:29 GMT
Content-Type: text/html; charset=iso-8859-1
Server: Apache
X-Powered-By: PHP/5.1.2-1.dotdeb.2
Connection: close

저작자표시

'랭귀지 > python' 카테고리의 다른 글

[python]crawler 샘플 (0)	2017.12.21
Python 에서 Mysql 사용 하기 (0)	2017.12.20
urllib2로 에러 처리하는 법 (0)	2017.12.19
urllib2 그리고 프록시 (0)	2017.12.19
SQLite - 단순하게 만든 데이터베이스 (0)	2017.12.19

공유하기 링크

페이스북
카카오스토리
트위터

'랭귀지/python' Related Articles

Comments

아미(아름다운미소)

urllib2: 무엇을 받고 있는 거지? 본문

urllib2: 무엇을 받고 있는 거지?

'랭귀지 > python' 카테고리의 다른 글

티스토리툴바