发布网友 发布时间:2022-04-18 20:24
共1个回答
热心网友 时间:2022-04-18 21:53
这是因为知乎将网页数据做了gzip压缩。解压之后就可以了。
import sys
import urllib2
import StringIO, gzip
reload(sys)
sys.setdefaultencoding("utf-8")
def decodeGzip(data):
stream = StringIO.StringIO(data)
gziper = gzip.GzipFile(fileobj=stream)
return gziper.read()
#此处填链接,百度可能会屏蔽链接所以把链接内容省略了
url = ""
resp = urllib2.urlopen(url)
text = resp.read()
print decodeGzip(text)