爬虫插件开发需求

爬虫插件的需求:

采集源管理,输入不同的采集源的列表页网址,能带分页页码参数。例如我要采集列表页第1页到第10页

列表页采集主要是采集详情页的URL地址,能自定义采集规则,锁定URL的位置。

能自定义详情页的采集规则,可以设置采集的字段与系统的栏目模型字段匹配,形成一对一的关系,自动入库,自有当字段都匹配上了,才能采集成功。采集回来的数据需要做整理,数据为待审状态。




要回复问题请先 登录注册

发起人

qzuser

要么庸俗,要么孤独
1 month ago
你好! 你还没有登录,请先登录. 登录CmsWing内容管理框架

3 个月前

最近活动

1249

浏览次数

关注者: 1 人

网站导航