36 lines
893 B
Plaintext
36 lines
893 B
Plaintext
# HTTP请求
|
||
requests==2.31.0
|
||
httpx==0.27.0 # 支持HTTP/2,比requests更快
|
||
|
||
# HTML解析
|
||
beautifulsoup4==4.12.3
|
||
lxml==5.1.0 # 更快的解析器,比html.parser快很多
|
||
parsel==1.9.0 # Scrapy的解析库
|
||
|
||
# 异步爬虫
|
||
aiohttp==3.9.5 # 异步HTTP客户端
|
||
aiofiles==23.2.1 # 异步文件操作
|
||
|
||
# 模拟浏览器(对付Vue/React等SPA)
|
||
playwright==1.42.0 # 推荐,现代浏览器自动化
|
||
selenium==4.18.1 # 经典方案
|
||
|
||
# 代理和反爬
|
||
fake-useragent==1.5.1 # 随机User-Agent
|
||
requests-html==0.10.0 # 支持JS渲染(基于pyppeteer)
|
||
|
||
# 数据存储
|
||
pymongo==4.6.1 # MongoDB
|
||
redis==5.0.1 # Redis
|
||
pymysql==1.1.0 # MySQL
|
||
|
||
# 数据处理
|
||
pandas==2.2.1 # 数据分析
|
||
numpy==1.26.4 # 科学计算
|
||
|
||
# 爬虫框架
|
||
scrapy==2.11.1 # 重量级爬虫框架
|
||
|
||
|
||
fastmcp
|
||
mcp[cli] |