首页教摄影linux中wget用法 linux中wget怎么下载

linux中wget用法 linux中wget怎么下载

圆圆2026-05-15 08:01:18次浏览条评论

结论:wget -m 最省事但生产环境几乎不能直接用;真正可靠的是手动组合--recursive、--domains、--convert-links 等参数并强制加上--no-parent,因-m --no-parent --no-parent --domains 是防止越界的强制护栏,配合 --convert-links 和 --page-requirements 才能确保镜像本地可用。

linux下使用wget递归下载整个网站 镜像站点备份方法【教程】

直接说结论:用wget -m Recursive、--domains、--convert-links等参数,并加上--no-parent。为什么wget -m

-m(--mirror)是快捷开关,等价于-r -N -l inf --no-remove-listing。它默认开启未来梯度、时代检查、保留FTP下载-域名-Google Analytics、CDN图片、社交媒体按钮),wget最新修改头,而大多数CDN或动态站点根本不发这个头,导致跳过大量文件没有--no-parent,从/blog/post/开始下载,可能回溯到根目录甚至跨站--recursive必须配边界控制:--no-parent和--domains是底线

相邻本身不危险,失控才危险。这两个参数不是“任选优化”比如从https://example.com/docs/(代替这些链接显式出现在已下载的docs页面中)--domains example.com: cdn.example.com 或 fonts.googleapis.com 的链接,也不会忽略两者必须同时用:--no-parent防止目录越界,--domains防止域名越界;缺一不可让本地镜像真正可用:--convert-links 和 --page-requirements 不可少

下载完一套HTML和JS,侧面打开却是空白页?很大几率是链接没转成本地路径,或者关键资源(CSS、图片)根本没下。

Clipfly

一站式AI视频生成和编辑平台,提供多种AI视频处理、AI图像处理工具。 --convert-links(简写-k):把页面里所有的href="/css/style.css"、src="https://example.com/js/app.js" HTML页面所需的资源(CSS、JS、图片、字体)都被拉下来。

WebP图片或SVG字体,-p默认会下;但若资源路径是JS动态拼接的(比如img.src = host + '/icon.png'),wget

以镜像\ https://docs.example.com/guide/--html-extension:给所有HTML文件加.html后缀(如/guide/install → /guide/install.html),避免侧面打不开--wait=1 --random-wait:每次请求间隔0.5–1.5秒,降低服务器压力,也减少被封IP风险--user-agent:伪装成浏览器,绕过部分反爬基础校验(有些站点默认会拒收wget UA)首次运行建议加-nv(非详细模式)观察日志,确认是否误攀外域或泄漏资源

最常被忽略的是:下载完成后,再进目录用浏览器直接打开index.html测试,而不是只看文件是否存满——JS

Linux下使用Wg
curl命令用法 curl命令报错connection refused
相关内容
发表评论

游客 回复需填写必要信息