vps交流

[全球爬虫论坛] python获取的网页和浏览器的结果不一致


最近想冲刺一下考研, 所以就上去P站看考研的视频(咳咳咳)
使用python获取网页源码的时候发现用re匹配不到结果
最后我把python爬下来的内容用浏览器打开看看,发现直接提示
no valid source are available for the video
了, 加了cookie和UA也是一样, 代理和浏览器用的是同一个, mjj有啥解决思路嘛?

地址: {P站主域名}/view_video.php?viewkey=ph620dd32bd1ec4

正常的返回网页结果应该有 media_4 这个关键词的

换个姿势,用selenium 或者puppeteer
2楼正解,稍微有点反爬的re处理都比较麻烦
大概率是js加载的数据 直接上selenium
selenium多慢啊, 要是js渲染的就去解这个js[全球爬虫论坛] python获取的网页和浏览器的结果不一致