news 2026/5/7 20:11:09

huggingface-cli download 断点续传

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
huggingface-cli download 断点续传

在使用huggingface-cli download时,断点续传的核心是--resume-download参数,该参数能检测本地未完成的下载文件,从断点处继续传输(而非重新下载)。以下是完整的使用方法、生效条件和问题排查:

一、核心原理

--resume-download会在下载时生成临时文件(后缀通常为.tmp),记录已下载的字节数;当下载中断(网络断开、进程终止等),重新执行带该参数的命令时,工具会读取临时文件,从断点处续传,避免重复下载已完成部分。

二、前提准备

确保huggingface-hub版本足够新(v0.10+ 支持该参数,v0.16+ 对大文件/LFS 文件支持更完善):

pipinstall--upgrade huggingface-hub

三、断点续传的具体用法

1. 基础用法(以下载 LiveCodeBench 为例)

在原有下载命令后直接添加--resume-download即可:

huggingface-cli download LiveCodeBench/LiveCodeBench\--local-dir LiveCodeBench\# 本地保存目录--local-dir-use-symlinks False\# 强制下载文件(非符号链接)--resume-download# 核心:断点续传参数
2. 结合筛选规则(include/exclude)

若仅下载指定文件/排除部分文件,续传参数仍兼容:

huggingface-cli download LiveCodeBench/LiveCodeBench\--include"data/**,evaluation/*.py"\# 只下载指定目录/文件--exclude"docs/**"\# 排除无需下载的内容--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download
3. 下载指定版本 + 断点续传

若需下载特定分支/commit/tag,续传参数同样生效:

huggingface-cli download LiveCodeBench/LiveCodeBench\--revision v1.0\# 指定版本(分支/标签/commit hash)--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download
4. 自动重试 + 断点续传(网络不稳定时)

搭配--retries N(N 为重试次数),实现中断后自动重试 + 续传:

huggingface-cli download LiveCodeBench/LiveCodeBench\--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download\--retries5# 最多自动重试5次

四、断点续传生效条件

  1. 本地保留了中断后的临时文件:--local-dir目录下会生成.tmp后缀的临时文件,不要删除/移动
  2. 重新执行的命令与中断前完全一致:包括--local-dir--include/--exclude--revision等所有参数,否则会视为新下载;
  3. 目标文件在 Hugging Face Hub 上未被修改:若文件更新,工具会判定为新文件,重新下载。

五、常见问题排查

1. 断点续传未生效(重新从头下载)
  • 原因1:huggingface-hub版本过旧 → 执行pip install --upgrade huggingface-hub升级;
  • 原因2:临时文件被删除 → 中断后不要清理--local-dir目录,保留.tmp文件;
  • 原因3:命令参数不一致 → 确保重新执行的命令和中断前的参数完全相同(比如--local-dir路径不能改);
  • 原因4:文件在 Hub 上已更新 → 可删除本地旧文件后重新下载。
2. 报错 “Resume download not supported for this file”
  • 原因:旧版本对 LFS 大文件的断点续传支持不足 → 升级到huggingface-hub>=0.16.0即可解决。
3. 续传时提示文件校验失败
  • 原因:中断导致临时文件损坏 → 删除该文件的.tmp临时文件,重新执行命令(会从头下载该文件,但其他文件仍可续传)。

六、补充说明

  • --resume-download幂等的:即使文件已完全下载,执行带该参数的命令也不会重复下载,只会校验文件完整性;
  • 若需强制重新下载(忽略断点):移除--resume-download参数,或删除--local-dir目录后重新执行。

参考

livecodebench/code_generation_lite

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 4:15:13

基于二阶锥松弛与智能软开关技术的MATLAB含SOP配电网重构策略研究

MATLAB代码:含SOP配电网重构 关键词:配网重构 yalmip 二阶锥 参考文档:《二阶锥松弛在配电网最优潮流计算中的应用》 仿真平台:MATLAB 主要内容:参考文献2 高比例新能源下考虑需求侧响应和智能软开关的配电网重构参考3…

作者头像 李华
网站建设 2026/4/25 12:14:12

PyTorch安装失败常见原因分析及Miniconda-Python3.10镜像应对策略

PyTorch安装失败常见原因分析及Miniconda-Python3.10镜像应对策略 在人工智能项目启动的前夜,你是否经历过这样的场景:代码已经写好,数据准备就绪,却卡在了最基础的 pip install torch 这一步?终端里滚动着一长串红色错…

作者头像 李华
网站建设 2026/5/3 19:20:36

苹果、谷歌都在用的技术,正在悄悄改写医疗健康数据应用范式?

医疗健康行业已然迈入AI时代,而数据正是驱动这一时代医疗创新的核心要素。 一方面,信息化、数字化的兴起使得医疗健康数据指数级增长;但另一方面,我国医疗健康数据应用效率较低、价值挖掘不够等问题仍旧突出 医疗健康数据应用困…

作者头像 李华
网站建设 2026/5/6 15:08:13

99页精品PPT | 智能工厂整体规划方案及实施细部方案

该方案通过智能制造系统的全面规划与实施,将其打造成为国内炊具行业的标杆企业,实现从传统制造向智能制造的转型升级。方案涵盖了从企业现状分析、智能工厂目标设定、整体规划方案制定,到具体的实施细部方案及预期效益评估等多个层面。在企业…

作者头像 李华
网站建设 2026/5/4 5:55:19

数据准度决胜AI时代:数眼智能VS博查搜索API深度测评

一、核心差异直击:为何数眼智能成准确性首选? 对比维度 数眼智能搜索 API 博查搜索 API 数据提取深度 99% 结构化全量提取(含逻辑层级与细节数据) 浅层摘要提炼(核心主题描述,细节丢失率高&#xff09…

作者头像 李华
网站建设 2026/5/1 10:58:16

HTML可视化报告生成:在Miniconda-Python环境中集成Plotly与PyTorch

HTML可视化报告生成:在Miniconda-Python环境中集成Plotly与PyTorch 在当今AI研发日益工程化的背景下,一个常见的挑战摆在每位数据科学家面前:如何让训练日志不再只是终端里一闪而过的数字?如何让团队成员无需运行代码就能直观理解…

作者头像 李华