本帖最后由 深海空间 于 2022-5-7 22:10 编辑
最近有个需求,就是按照搜索关键字然后爬取国内某个网站的图片并发送到TG bot,现在遇到了一个问题,就是这个站点用的图床是一个叫做imgsto的图床,这个图床有一个恶心的地方就是点进去之后他会叫你点击一个叫做 Continue to image 的按钮(这个按钮要点好几次才可以点到),这个简单,我就撸了几行python代码获取真实链接
然后把这个链接发给TG bot的时候死活得到400的结果,最后经过测试发现,这个返回来的链接好像时关联访问IP的,当我使用其他IP来访问这个我得到的real_url时会得到一个 Wrong IP 的结果
现在我想问的是,要怎么按照原来的设想,我输入关键字之后脚本自动把这张图发送到bot呢? 我目前自己想的一个方法就是先把这个图片解析完之后下载到本地,然后再本地上传到TG服务器,但是这样每一张图都涉及到一次IO操作 有没有什么办法避免呢?比如存到内存之类的(可以吗?)这样就不用一直往复写入硬盘了 或者说各位MJJ有没有其他更优雅的方式?
得到六楼提醒,直接使用request的content对象解决了多次操作IO问题 |