大家一起进步吧!感谢大家的支持和关注
爬虫目录
- 爬虫目录
- 体验搜狗在线翻译
来句废话:你要带着点知识来学知识
-
html
-
jQuery
-
python基础语法
爬虫目录
体验搜狗在线翻译
import requests
# 请求参数动态化
keyword = input('请输入关键字:')
# 稍后想要把该字典作为请求参数
prams = {
'query': keyword, # 只存在一个键值对(存在一组请求参数)
}
headers = { #存放需要伪装的头信息
"User-Agent":"Mozilla/5.0 (Windows NT 11.0; Win64; x64)"
}
# 1.指定url
url = 'https://fanyi.sogou/text' # 需要将请求参数去除
# 2.发起请求
# params参数就是用来在请求时携带指定的请求参数
response = requests.get(url=url, params=prams,headers=headers)
# 3.获取响应数据
page_text = response.text
# 4.持久化存储 注意加编码形式,文件是保存在当前目录下的,打开就是我们输入内容的翻译页面
fileName = keyword + '.html'
with open(fileName, 'w',encoding="utf-8") as fp:
fp.write(page_text)
# 出问题:没有爬取到我们想要的数据?原因是因为遇到反爬机制
# 模拟浏览器发起 加UA
请背上你的行囊-->出发
-
动态查询参数
- 反扒机制—>
模拟浏览器UA伪装
看到这,相信大家已经有所收获,下面还请再接再厉,大家有什么好的建议还请评论留言,小编也会不断的完善自身的缺陷。
发布评论