Crawlsy开源项目

我要开发同款
proginn00475073622025年11月18日
9阅读

技术信息

语言技术
PythonVue
系统类型
Web
行业分类
项目任务
开源地址
https://github.com/yunhai-dev/crawlsy
授权协议
GPL许可

功能介绍

Crawlsy 是一个分布式爬虫管理平台,支持多种爬虫框架,致力于提供一个简单、高效、稳定的爬虫管理系统。
前端应用与主节点(Django Backend)交互,主节点负责与 MongoDB、Redis、MySQL 和工作节点进行通信。主节点和工作节点之间通过 gRPC 框架相互通信。任务由主节点中的 Celery Beat 模块进行调度,并通过 Redis 消息队列分发到工作节点,这些任务在工作节点的运行器中执行。爬虫运行器在执行过程中,通过集成的 gRPC 将采集到的数据直接写入 MongoDB,同时任务状态通过 Celery Worker 更新到 MySQL 中。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论