如何完整地批量保存网页
发布网友
发布时间:2022-04-29 15:19
我来回答
共6个回答
热心网友
时间:2022-05-04 23:04
下面方法可行已测试:
Offline Explorer Pro (Enterprise也可)
安装运行,新建项目,项目-地址中填写
http://bbs.gongzhou.com/thread-97531-{:1..2301}-1.html
下面的级别*为1
其他的视频等可选择不要,只要文本,图像,其他。不改也没关系,不过是下载时间会长些。
在OE右边的内部浏览器窗口输入那个帖子页面地址,并登录一次。没有用户名的话注册一个。
运行下载,等待结束。
结束后图片其实均已下载,如果你的目的只是弄到那些图,那只要到下载目录(默认是c:\download\bbs.gongzhou.com)去把它们移出来就可以了。
如果你是一定要所有的页面在本地浏览时正常显示图片,那么再要装一个TextPipe软件。Offline Explorer在工具-数据挖掘里可以和TextPipe连动,不过也可以手动运行TextPipe。
安装TextPipe并运行。向导里下一步下一步不用改,过滤器里选择查找和替换,添加,完成。在查找里填
<img src="images/common/none.gif" file="([^\.]*).jpg"
查找类型选择
模式(Perl)
在替换里填
<img src="$1.jpg"
选择c:\download\bbs.gongzhou.com\目录下
从thread-97531-1-1.html
到thread-97531-2301-1.html
的所有html文件,拖到TextPipe的要处理文件里
按下面的开始-真正运行。
等待结束后即可。
我测试了前三页没有问题。
加了一些*排除掉些不要的文件,OE下载了1000多个文件,要是过滤*再紧一点应该可以再减少。打包发送是困难了,按他每页10张照片共1.5M来算,2千页就有3G以上了。
几点PS,不看也可
1 登陆论坛的目的是为了搞到他下载版本的1.jpg 2.jpg等等,不登陆也应该可以直接弄到帖子里贴的图
2 下载后页面不显示图是因为他帖子里贴图用的是img src=" images/common/none.gif"-这个是空的图 file=真实地址的标签,所以用替换把src改成实际地址就能显示
3 不一定要用TextPipe,随便一个支持批量操作且能用正则表达式查找替换的文本处理软件也可以。我那正则写的不好,比如.该用\.的,算了能用就行
热心网友
时间:2022-05-05 00:22
(这个例子的服务器会屏蔽连续下载请求,不适合测试)
下载可以用:
Offline Explorer Enterprise
(需要pro或者Enterprise版)
安装后运行,建立任务时第一步的任务链接栏输入下面一行:
http://bbs.gongzhou.com/thread-97531-{:1..2301|1}-1.html
其它设置基本默认就可以.(设置相当多,可以保留你需要的图片,排除不需要的东西等等.)
运行后,一般特殊的代码都被程序在html中转向到本地相对路径的目录中,可以脱机浏览(某些flash和特殊的代码仍不能支持).
这个程序,用吧,很强.
另外同类的webzip也可以.
热心网友
时间:2022-05-05 01:56
我猜想你更希望把每页保存为txt格式,并且从001.txt, 002.txt重新编号。
试试Replace Pioneer, 支持批量下载为txt文件,同时支持重命名。
首先准备一个文本文件,每行是一个以http开头的你要下载的页面地址。然后:
1. 打开Tools->Batch Runner菜单。
2. 点击Import List按钮,把准备的文件导入。
3. 如需下载为txt文件,只需双击文件列表里的任意一行,把Download As这一行从html改选为text,完成后选中右边的Apply.然后点击ok.
4. 下载的文件会被缺省的保存在c:\temp,如需修改,选择Change Output Folder,输入新目录。
5. 点击Copy/Download按钮,点击Yes即可。
如有需要,在第5步之前通过修改Set output filename对下载的文件自动重命名。比如#####.txt会把文件重命名成00001.txt的格式。
热心网友
时间:2022-05-05 03:48
http://bbs.gongzhou.com/thread-97531-1-1.html
从这个地址看,这是个bbs啊,这里边的东西恐怕都是动态网页,只是返回来html而已。不太好办。
如果是普通网页的话,它们基本都是在一个路径下,lz提到的不知道是不是网站抓取工具,即使是也不是常用的,找些个网站抓取工具吧,我以前用过几个都挺好,可惜不知怎么我再也找不到它们的名字啦…………%>_<%
热心网友
时间:2022-05-05 05:56
完整地批量保存每一页的内容还没有这个功能 至少现在没有 人工手动操作吧
热心网友
时间:2022-05-05 08:20
迅雷,新建-批量任务,地址栏前半我省略了:
...../thread-97531-(*)-1.html
下面从1到999,通配符长度1
怎样保存网页上的所有内容
保存方式有如下四种:1.保存为书签 保存为书签是最常见的保存网页的方式之一。在浏览器的地址栏旁边有一个小图标,点击它就可以将当前网页保存为书签。保存后,我们可以在浏览器的书签栏或书签管理器中找到并随时打开。2.保存为PDF 如果我们需要保存网页的全部内容,包括文字、图片和格式,可以将网页保存...
如何把doc文件转换成PDF格式?
"1.当然可以,首先要确定自己有一个pdf文档,而且确定目的是需要将pdf文档转换为word格式,然后我们将现有文档通过迅捷pdf转换器软件打开。2.通过选择PDF转换页面功能其中的PDF文件转WORD项目拖入文件。3.接着在迅捷pdf转换器下方按自己的需要是否更改文件名,然而在保存类型中选择*.doc选项。4.全部设置完成点击开始转换,确定自己设置好路径、更改文件名和保存类型即可。5.转换完成之后的word文档同样可以通过迅捷pdf转换器重新转换成一开始的pdf文档。"1.当然可以,首先要确定自己有一个pdf文档,而且确定目的是需要将pdf文档转换为word格式,然后我们将现有文档通过迅捷pdf转换器软件打开。2.通过选择PDF转换页面功能其中的PDF文件转WORD项目拖入文件。3.接着在迅捷pdf转换器下方按自己的需要是...
如何完整保存网页全部内容
在360浏览器中,操作非常简单。只需按下CTRL+M,您就可以将整个网页以jpg、png或bmp格式的图片形式完整保存。如果需要更全面的保存,可以选择CTRL+S,这将允许您保存网页的所有内容,包括图片和HTML代码。
如何完整保存网页全部内容
1、打开相关的浏览器主页,点击窗口右上角的【设置】按钮-->【附件组件】。2、在搜索框中输入【MAF】后回车搜索。3、搜索结果中的【Mozilla Archive Format】就是要找的插件,点击【安装】按钮。4、安装完成后,点击【立即重启】。5、遇到重要的网页时,就可以右键单击,选择【将网页另存为】。6、...
如何保存网页。怎么办?
1. 打开想要保存的网页。2. 在键盘上按下Ctrl+S组合键或者鼠标点击浏览器右上角的菜单按钮选择保存网页选项。3. 选择保存的位置和文件名,点击保存即可。这样就可以把网页保存到本地硬盘上,可以随时打开查看。这对于保存经常访问或重要的网页特别方便有效。同时这种方法也适用于保存整个网站的网页内容。...
如何完整保存网页全部内容
一种方法是通过全选复制然后在Word中粘贴,最后保存为html格式就可以了.一模一样的,很方便!如果觉得IE中另存为很慢就可以试试这个方法.用这种方法还有一个有点就是只保存自己觉得有用的.没用的可以不选.或者在Word中将其删除.既方便查看又减小体积.另外一种方法就是用专门的软件来实现.不知道你有没...
怎么将网页完整地保存到电脑中
1、先打开自己想要保存的网页,这里用酷知网网页为例,如图所示,打开即可。2、接着点击右上角的三个点,这里是设置所放的地方,直接点击这个地方即可。3、然后选择更多工具,接着点击网页另存为,这里用的是搜狗浏览器,如果版本不一样,自己再进行修改。将网页保存在自己比较容易找到的地方即可,点击...
怎么一习性保存多页网页
可以用整站下载快速保存多页脱机网页。操作步骤:打开整站下载软件,弹出如图所示对话框。单击“菜单栏”——新建项目向导。弹出“新建项目向导”对话框,勾选“在我们的硬盘中创建一个可浏览的网站副本”,单击“下一步”。在弹出的对话框中输入网址,选择你要保存链接的层级。在弹出的对话框中选择下载的...
怎么保存网页?
首先,打开你想要保存的网页,确保网页已经完全加载完毕。然后,在浏览器中找到“文件”或“File”菜单,选择“另存为”或“Save As”选项。这将打开一个新的对话框,让你选择保存网页的位置和文件名。在对话框中,你可以选择保存网页的完整版本,包括所有的...
Mac如何将长网页完整保存为PDF?
下一步,只需确认设置无误,然后直接点击保存按钮,网页就会被转换为PDF文件保存到你的电脑中。这个功能在需要整理资料或复制内容时尤其实用,比如想下载整篇论文时,只需简单几步,就无需再寻找其他工具,Mac系统已经为你提供了方便。现在你已经掌握了如何在Mac上高效地保存整个网页到本地了。
如何保存整个网站?
保存整个网站方法:1、百度下载一个仿站工具 2、解压仿站工具压缩包 3、打开仿站小工具 4、输入需要保存的网站网址 5、点击下一步 6、设置保存网站的文件夹后,点击下载即可 7、下载完成