网上很多教程以网页形式呈现,希望能够将整个教程下载到本地离线看,以下命令非常有用:
wget -r -p -np -k http://xxx.com/xxx
参数解析:
- -r, –recursive(递归) specify recursive download.(指定递归下载)
- -k, –convert-links(转换链接) make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)
- -p, –page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)
- -np, –no-parent(不追溯至父级) don’t ascend to the parent directory.
- –no-check-certificate(忽略https证书验证)本地校验颁发者的权限,即无法本地验证https证书,要以不安全的方式连接,使用“–no-check-certificate”
wget --restrict-file-name=ascii -m -c -nv -np -k -E -p http://xxx.com/xxx wget --restrict-file-name=ascii -m -c -nv -np -k -E -p http://xxx.com/xxx
参数释义如下:
- –restrict-file-name=ascii ,将文件名保存为ASCII格式。这样能避免utf-8文件名带来的麻烦(注:1.12版才支持ascii参数值)
- -m 整站下载,mirror的缩写,是-N -r -l inf –no-remove-listing 这几个参数的快捷方式,具体详阅各自的说明
- -c 续传
- -nv 不显示详细的下载详情
- -np don’t ascend to the parent directory.即下载的Web页面不越过后面指定的 http://www.xxx.com的范围。当然,如果你指定的是 http://www.xxx.com/aaa,则所有的web页面都要在 http://www.xxx.com/aaa下
- -k 下载完成后,将页面文件中的链接转换为本地链接,便于离线浏览和制作chm等
- -E 保存html/css文件时,使用合适的文件后缀。例如,在某些网站有些文件是服务器端动态生成的,虽然是css文件,但后缀并不是css,-E选项可以调整之
- -p -np对页面文件做了限制,如果不加-p,则html所需的媒体文件也会受限于-np,-p则会下载html/css文件所需的所有媒体文件(图片、音频、视频等)
- -R 拒绝下载的文件后缀列表,逗号分隔
发表回复