python 爬虫
设置headers
1 | headers = { |
zh-CN: 最高优先级,客户端最希望收到简体中文的内容。
zh;q=0.8: 如果服务器不能提供 zh-CN,那退而求其次接受普通中文,优先级稍低。
en-US;q=0.6: 如果没有中文版本,接受美式英文。
en;q=0.4: 最低优先级,接受其他形式的英文。
作用: 设置 HTTP 请求头,比如伪装成浏览器、添加认证信息等
设置proxies
1 | proxies = { |
设置请求代理服务器
设置params
1 | params = { |
作用: 传递 URL 查询参数(即 ?key=value 形式)
设置cookies
1 | cookies = { |
作用: 传递 cookies,即 HTTP 请求中的 cookie 信息
设置auth
1 | from requests.auth import HTTPBasicAuth |
作用: 提供 HTTP 基本认证
设置allow_redirects
1 | response = requests.get(url, allow_redirects=False) |
是否允许重定向(默认 True)
设置verify
1 | r = requests.get('https://expired.badssl.com', verify=False) |
是否验证 SSL 证书(默认 True)