news 2026/6/8 22:32:50

新浪微博相册下载器:多线程批量抓取高清原图

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
新浪微博相册下载器:多线程批量抓取高清原图

文章目录

  • 新浪微博相册下载器:多线程批量抓取高清原图
    • 1、解决了什么问题
    • 2、技术原理
    • 3、使用方式
    • 4、使用场景和注意事项
    • 5、适合谁

新浪微博相册下载器:多线程批量抓取高清原图

Sina-Weibo-Album-Downloader 在 GitHub 上拿到了 129 Star。

这是一个 Python 3 写的命令行工具,功能单一:用多线程从新浪微博相册里下载高清原图。输入用户的 OID 和 cookies,运行后自动遍历相册列表、抓取每张图片的原始尺寸地址,并发写入本地磁盘。

1、解决了什么问题

微博相册中存放着大量摄影师作品、插画、Cosplay 照片和活动记录。浏览时可以正常看图,但想要保存原图只能逐张点击大图后另存。相册页数一多,操作成本陡增。

微博官方没有提供批量下载功能。第三方工具有的已经停止维护,有的需要付费,也存在因合规问题被下架的情况。这个开源脚本回避了这些问题:只要微博的相册 API 保持可用,脚本的调整空间比 GUI 工具大。

2、技术原理

核心依赖只有一个 requests 库,不依赖爬虫框架。工作流程分两阶段:先通过微博的相册列表接口获取指定用户的所有相册及其中每张图片的 ID,再逐张请求原图 URL 并写入文件。多线程并发在第二阶段发挥作用,同时拉取多张图片,比顺序下载快得多。

OID 是微博用户的数字唯一标识,可以从用户主页 URL 中直接提取。cookies 用于通过登录状态校验,需要在浏览器登录微博后从开发者工具中复制。

3、使用方式

操作分为三步:

  1. 打开浏览器开发者工具,定位目标用户的微博主页,从 URL 或页面请求中获取 OID,同时复制完整的 cookies 字符串。
  2. 将 OID 和 cookies 填入脚本中标注的位置。
  3. 在终端执行 Python 脚本,图片会自动下载到当前目录。

整个过程不需要安装数据库、不需要配置代理,Python 环境里执行pip install requests之后就能跑。

4、使用场景和注意事项

备份是首要场景:把自己的微博相册完整下载到本地,防止账号异常或图片被删除后数据丢失。其次是素材收集:摄影、设计、绘画领域的创作者常在微博相册发布高分辨率作品,批量下载后可以离线浏览和整理。

几点需要注意:cookies 有过期时间,失效后需要重新获取。下载频率过高可能触发微博的请求限制,可以按需调整脚本中的线程数和请求间隔。项目使用 Apache 2.0 许可证,允许自由修改和分发。

5、适合谁

  • 需要备份自己或他人微博相册内容的用户
  • 摄影、设计、绘画爱好者,希望批量收集参考素材
  • 有基础 Python 使用经验、能独立获取 cookies 和 OID 的开发者
  • 对微博数据采集感兴趣、想在此脚本基础上做二次开发的人

okies 和 OID 的开发者

  • 对微博数据采集感兴趣、想在此脚本基础上做二次开发的人
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 22:31:50

rog电脑安装ubuntu双系统遇到的问题

全程视频跟着b站视频做的【Windows11 安装 Ubuntu 避坑指南-哔哩哔哩】 https://b23.tv/fOxfRaS但是在关闭intel rst的过程中一直找不到,后来了解到可以通过关闭vdm来解决回来。后面关闭vdm后正常安装ubuntu,但是切换win系统就一直进不去,报错…

作者头像 李华
网站建设 2026/6/8 22:31:08

基于 Harmony 6.0 应用的 AR 汉字学习应用首页实现

基于 Harmony 6.0 应用的 AR 汉字学习应用首页实现 前言 汉字是中文学习者最大的挑战——3500 个常用字、每个字平均 10 个笔画、每个字有独特的音形义。传统的"抄写 默写"对儿童来说枯燥得让人抗拒。AR 汉字学习应用通过摄像头识别真实物体后弹出相应的汉字、动画演…

作者头像 李华
网站建设 2026/6/8 22:30:02

i.MX 8M Mini功耗实测与优化:从电源域解析到低功耗设计实战

1. 项目概述:为什么我们需要精确测量处理器功耗?在嵌入式系统开发领域,尤其是面向电池供电或对散热有严格要求的设备,功耗从来都不是一个“差不多就行”的指标。它直接关系到产品的续航时间、发热量、电源系统设计复杂度&#xff…

作者头像 李华
网站建设 2026/6/8 22:28:43

AMAT 0190-64978/03控制器模块

AMAT 0190-64978/03 控制器模块是应用材料半导体设备中专用于系统控制与通信的核心模块,其核心特点总结如下: 部件编号0190-64978/03,其中/03表示硬件版本号。 属于AMAT设备内部的专用控制备件。 主要用于设备各子系统之间的数据通信与逻辑…

作者头像 李华
网站建设 2026/6/8 22:28:01

VMware迁移上云的10个生死关

迁移规划与评估 分析现有VMware环境的工作负载、依赖关系和性能需求,明确迁移目标和优先级。评估云服务商的兼容性和成本模型,避免因规划不足导致的迁移失败或预算超支。网络架构重构 云环境的网络设计与本地VMware架构差异显著,需重新规划VP…

作者头像 李华
网站建设 2026/6/8 22:27:36

拆解电流互感器:铁芯、绕组与绝缘,每个部件都不简单

拆解电流互感器:铁芯、绕组与绝缘,每个部件都不简单在电力监控、电源管理及新能源BMS系统中,电流互感器(CT)承担着电流采样与电气隔离的双重任务。很多工程师对互感器的选型比较熟悉,但对它内部到底由什么组…

作者头像 李华