vps交流

[疑问] 关于火车头(高铁)关联分页的问题,来个彦祖解答下


本帖最后由 Twice 于 2022-5-10 18:12 编辑

问题很简单:
用火车头(高铁)采集小说这种类型的数据,
1.txt
2.txt
这类的,但是别人的网站存在分页。也就是1.txt这个章节分成1-3或者更多页面。

我用火车头采集这种页面,既要1-2-3-4-5-6.TXT这个章节,也需要把1.txt(1-3)在后台合成一个章节。

搞了一下午了,没有弄出头绪,来个大佬讲讲是软件本身的原因还是我思考有盲区。

[疑问]  关于火车头(高铁)关联分页的问题,来个彦祖解答下

loc.rar

半小时前 上传

点击文件名下载附件

1.83 KB, 下载次数: 0

高铁规则

采集内容时候本身就有分页功能的吧

本人马保国 发表于 2022-5-10 18:05
采集内容时候本身就有分页功能的吧

存在分页功能,但是内容是下一页下一页这种类型的,如果到达下一章这种程度就无法识别了。
我需要的是识别这个下一章做出判断。

本人马保国 发表于 2022-5-10 18:05
采集内容时候本身就有分页功能的吧

意思是多级内容分页,1下面有1-3,2下面有1-3,以此类推

最近我也在研究火车头,等回去看看