python
小于 1 分钟
安装
- python2
- python3
- pip
国内镜像源地址
# 阿里云 https://mirrors.aliyun.com/pypi/simple/
# 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
# 豆瓣(douban) https://pypi.douban.com/simple/
# 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
# 中国科学技术大学 https://pypi.mirrors.ustc.edu.cn/simple/
pip install scrapy -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install fake-useragent -i https://mirrors.aliyun.com/pypi/simple/
虚拟环境
基础语法
界面
爬虫(不要拿来做不好的事情)
请遵循robots.txt的规则
常用库
- requests
- scrapy
xpath
去匹配元素