Go to file
dai_48k 05d5646587 draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
.idea draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
common draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
rss-filter draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
rss-solver-plugin-xhs draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
rss-solver-protocal draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
rss-solver-web draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
rss-solver-web-frontend draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
.gitignore draft-2025-07-18_核心功能初稿 2025-07-18 16:30:27 +08:00
README.md draft-2025-07-23_BUG修复与配置存储 2025-07-23 14:44:06 +08:00
pom.xml draft-2025-07-18_核心功能初稿 2025-07-18 16:30:27 +08:00
rss.iml draft-2025-07-18_核心功能初稿 2025-07-18 16:30:27 +08:00

README.md

当前文档仅草稿仍然处于draft个人开发调优阶段

模块功能:

  • common 通用类
  • rss-filter 规则过滤器(待定)
  • rss-solver-web 爬虫rss后端服务
  • rss-solver-web-frontend 爬虫rss前端服务
  • rss-solver-protocal 爬虫插件协议类
  • rss-solver-plugin-xhs 爬虫-小红书示例

RSS过滤

rss-filter-*

尚无思路

RSS爬虫

rss-solver-*

搭建环境需求

  1. java8+
  2. redis

基础设计思路

插件化开发。后端web程序提供基础逻辑实现负责对爬虫插件的管理和调用。

对于主程序来说可以从plugins目录下装载合适的插件一个插件拥有以下几个基础属性

pluginId: 组件容器注册名

cron组件定时任务执行表达式

route组件路由地址

key用户key如爬虫页面用户的uid列表该列表下的数据会一同处理

config支持额外的配置以供组件调用如cookies等

主程序

| -> 爬虫1

  -> 用户1

  -> 用户2

| -> 爬虫2

  -> 用户1

  -> 用户2

插件开发指南

插件开发协议指南