일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- node.js
- python
- 라즈베리파이
- 리눅스
- ASP
- 함수
- pandas
- MS-SQL
- GIT
- 맛집
- MySQL
- 유니티
- 다이어트
- flutter
- sqlite
- PyQt5
- urllib
- mssql
- ubuntu
- tensorflow
- IOS
- swift
- 날짜
- port
- Unity
- PyQt
- javascript
- Linux
- Excel
- PER
아미(아름다운미소)
urllib2: 무엇을 받고 있는 거지? 본문
HTTP 요청을 전송하면, html이나 이미지 또는 비디오 등등이 돌아온다.
어떤 경우에는 받고 있는 데이터의 유형이 예상대로 인지 점검해야 한다.
받고 있는 문서의 유형을 점검하려면, MIME 유형을 보자 (Content-type) 헤더:
urlfile = urllib2.urlopen('http://www.commentcamarche.net/')
print "Document type is", urlfile.info().getheader("Content-Type","")
이는 다음과 같이 출력된다:
Document type is text/html
경고: 쌍반점 다음에 정보가 있을 수 있다. 예를 들어:
Document type is text/html; charset=iso-8859-1
그래서 언제나 다음과 같이 하면:
print "Document type is", urlfile.info().getheader("Content-Type","").split(';')[0].strip()
오직 "text/html" 부분만 얻을 수 있다.
주목하자. .info()는 또한 다른 HTTP 응답 헤더도 돌려준다:
print "HTTP Response headers:"
print urlfile.info()
다음과 같이 인쇄된다:
Document type is Date: Thu, 23 Mar 2006 15:13:29 GMT
Content-Type: text/html; charset=iso-8859-1
Server: Apache
X-Powered-By: PHP/5.1.2-1.dotdeb.2
Connection: close
'랭귀지 > python' 카테고리의 다른 글
[python]crawler 샘플 (0) | 2017.12.21 |
---|---|
Python 에서 Mysql 사용 하기 (0) | 2017.12.20 |
urllib2로 에러 처리하는 법 (0) | 2017.12.19 |
urllib2 그리고 프록시 (0) | 2017.12.19 |
SQLite - 단순하게 만든 데이터베이스 (0) | 2017.12.19 |