最近想冲刺一下考研, 所以就上去P站看考研的视频(咳咳咳) 使用python获取网页源码的时候发现用re匹配不到结果 最后我把python爬下来的内容用浏览器打开看看,发现直接提示 no valid source are available for the video 了, 加了cookie和UA也是一样, 代理和浏览器用的是同一个, mjj有啥解决思路嘛? 地址: {P站主域名}/view_video.php?viewkey=ph620dd32bd1ec4 正常的返回网页结果应该有 media_4 这个关键词的 |
换个姿势,用selenium 或者puppeteer |
2楼正解,稍微有点反爬的re处理都比较麻烦 |
大概率是js加载的数据 直接上selenium |
selenium多慢啊, 要是js渲染的就去解这个js |