爬虫框架crawlee简介

这个项目在 GitHub 上快 2 万 Star 了,是个用 Node.js(还有 Python 版本)写的网络爬虫框架。 它最大的特点就是:爬虫行为更像真人,不容易被网站的反爬机制拦住。
比如你想抓 TikTok、YouTube 这类动态内容,它都能搞定。
而且自带 CLI 工具,一键生成项目结构,给你现成的模板。
支持 HTTP 请求,也能配合 Playwright 这种浏览器自动化工具去抓复杂网页, 内置了代理切换、请求队列、错误重试、数据存储…… 用一句话总结:非常适合想写爬虫但又不想造轮子的同学。

信息源