发新话题
打印

Offline Explorer使用教程oe扒站教程

Offline Explorer使用教程oe扒站教程

Offline Explo-rer 的出现,终于使我可以轻松自如地将心仪已久的网页保存到自己的硬盘了。
/ D1 Q4 l0 j0 p6 s: @; e本帖来源:网赚红利之家  http://www.gaminglistings.com
5 m# b" T2 ^5 o9 B- Z) N9 \本帖来源:网赚红利之家  http://www.gaminglistings.com到底 Offline Explorer 有些什么好处呢?现在让我们来一探究竟。打开 Offline Explorer 看看界面和 IE 好相像,是不是感到有一种亲切感?它没 Webzip 那种让人头昏的花哨吧!现在就跟我一起来作个轻松而简单的 Offline 之旅。 本帖来源:网赚红利之家  http://www.gaminglistings.com3 T0 L1 x% b6 Q- Z
本帖来源:网赚红利之家  http://www.gaminglistings.com3 I8 K$ D8 K6 r0 G2 w! d, D& y. [3 R7 b! U
 
! B  ]. F$ h# @本帖来源:网赚红利之家  http://www.gaminglistings.com
, I5 v+ x& f5 {; |# R本帖来源:网赚红利之家  http://www.gaminglistings.com现在你看上了哪个网页?我看上了 toberich 上的一个做海水的教学页面,写得不错,作出的效果也很好。就把页面拉到我的硬盘上吧。从 IE 的地址栏中复制这个网页的 URL www.toberich.cn,点击 Offline Explorer 工具栏上的弹出对话框,在 Address (URL) 中粘贴刚才复制的 URL,Project name 是设置本次任务的名称的,你可输入自己感兴趣的名字,我们暂且命名为 Nature water 吧。将下面的 Level limit 打上勾,并把其值设为 0,这样,就限定了要抓取页面的链接层次只为此页面所链接的文件,避免抓下过多无用的文件。File modification check 栏为默认的 Download only Modified files点下 OK。好像都设置得差不多了,这下可以开始下载网页了吧?等等,还没设置好下载文件保存目录呢。Offline Explorer 默认的下载的网页都保存在同一个目录中,点击工具栏上的 Options 按扭,在弹出窗口的 Category 栏中选择 Advanced DownloadDirectory,从右边的目录框中选择一个欲保存的目录就行了,以后下载的网页都保存在这个目录下面。设好目录后点下工具栏上的 Download 按钮就开始下载了。
# \5 f5 H7 r/ K8 u; X% L0 k) ]本帖来源:网赚红利之家  http://www.gaminglistings.com
! j: z& {$ f0 x$ m( \) e' f# d9 c本帖来源:网赚红利之家  http://www.gaminglistings.com下完后打开你放置下载页面的目录,可看到下载页面完全按照原来网站的目录结构排列,并且 Offline Explorer 会自动对HTML文件的超链接进行修改,保证链接的正确,即使随意复制到任何目录也不会影响超链接的正确性,这点可比 Teleport 强多了。如何,刚才的下载过程很轻松很简单吧。可是当你想要抓下一个网站的某部分内容时,Offline Explorer 需要的设置会稍微复杂些,下面我们就来试试。
, U7 `. I* H0 p/ c7 R4 N  M本帖来源:网赚红利之家  http://www.gaminglistings.com
  L! r  Z9 m0 O  y" f0 _本帖来源:网赚红利之家  http://www.gaminglistings.com台湾的视觉领航员(http://www.toberich.cn)是一个内容比较典型的大型商业网站:网站结构中除 HTML 文件外还包括有图片、动画、CGI 程序、ZIP 的打包软件及一些需要口令的页面等。用这样一个比较全面的网站来试验 Offline Explorer 的灵活及方便性是非常合适的。
2 V* |& n  s( Z8 q7 Q2 x" x本帖来源:网赚红利之家  http://www.gaminglistings.com本帖来源:网赚红利之家  http://www.gaminglistings.com, n2 ^8 w( ]5 T2 u5 X/ F6 |1 o
在抓取所需网页前,有必要对自己所要抓取的网站分一下类,否则以后下载的网站过多时查找就非常麻烦。点击工具栏上 NEW图标旁的小箭头选择 Folder。下方的 Projects 栏出现一个新的文件夹,更名为 3d site。由于我的 IE 收藏夹中已有视觉领航员的 URL 了,而且 Offline Explorer 可以直接引入 IE 的收藏夹,因此我们也可以不再用复制/粘贴的方式得到 URL。选中 3dsite 文件夹,点击菜单栏上的 File->Import Favorites->MS IE Favorites,再选中收藏夹中的站点,可看到 3d site 文件夹下已多了一个“V.N.Club on Line 视觉领航员”的站点了。 本帖来源:网赚红利之家  http://www.gaminglistings.com) t# j8 G3 Q) w/ e- @: B
本帖来源:网赚红利之家  http://www.gaminglistings.com$ C1 B2 `+ D( F  e+ s
在“视觉领航员”上击右键,选择 Properties,Level limit 的值可设大一点,因为这是一个大型的商业网站,而且链接层次比较深,如果层次设小了,有可能较深链接层次的网页无法被抓取,我现在设定的 Level limit 的值为6。由于此网站上有一些比较大的以 ZIP 格式打包的软件链接,因此在下载网页时可通过文件名来排除它们。点击左边的 FileFilters,把 Archive 这项关闭。在下载网页时,程序会自动根据右边所列出的文件扩展名来过滤掉所匹配的文件。 本帖来源:网赚红利之家  http://www.gaminglistings.com2 T: H! ?# F: d. v$ g
本帖来源:网赚红利之家  http://www.gaminglistings.com; Y( X- E5 Y3 L- `
展开左边的 URL Filters,Protocol (协议)项设为 Load all protocols,这样无论服务器是 FTP 还是 HTTP 的都可正常下载。Server 项我设为第三项oad files only within the starting server (仅从开始的服务器下载文件),这就限制了下载的文件仅能是  www.toebrich.cn上的。因为绝大多数网站都是相互做了链接的,如果以默认的第一项: Load filesfrom all servers,将会下载所有有链接的服务器上的文件,这样下载回来的无用文件往往比你所需要的文件多得多。对于网站上的目录,我们同样可以进行过滤,从页面上的链接可看出此网站下的 guestbook 目录放的是留言文件,对我们来说没什么实用价值,可以不用下载。在 Directory 项中选择 Custom directories configuration,在下面的 Keyword 栏输入 guestbook,单击“Add >>”按扭,并确认上面的下拉菜单为 View excluded files keywords。这样,我们就将 guestbook 目录过滤掉了。在Filename 项中也可用同样的方式对文件进行过滤。 本帖来源:网赚红利之家  http://www.gaminglistings.com5 ?6 V( }8 m1 I4 U4 Z0 w" U' w& {8 P' ?5 Y
本帖来源:网赚红利之家  http://www.gaminglistings.com# k! F) z# r/ c/ K' p
有时我们需要做一个网站的镜像,而默认的 Offline Explorer 却会自动修改 HTML文件中的链接。这时 Offline Explorer提供的关于链接转换的选项就起作用了。在 Properties->Advanced->Link Translation 中可选择如何进行链接的转换, No Translation 可对网站原封不对地做个镜像。现在,你本来可以随心所欲地对网站上自己所需要的网页进行抓取了。不过为了让 Offline Explorer 工作得更好,我们还须要对 Offline Explorer 的系统进行设置。 本帖来源:网赚红利之家  http://www.gaminglistings.com' ^4 ?5 [6 U1 ?$ }1 ?

- [5 _2 {5 F+ c9 U本帖来源:网赚红利之家  http://www.gaminglistings.com点下工具栏上的 Options 按扭,出现所示的窗口,在 Internet connection 栏中可设置 Offline Explorer 的并发连接数点下工具栏上的 Options 按扭,出现所示的窗口,在 Internet connection 栏中可设置 Offline Explorer 的并发连接数设定。下面的 Internal HTTP server 与 Agent identification 用默认值就可以了。一般不作更改。对于国外的网站,众所周知要比访问国内网站慢一些,用代理服务器可以较好地解决速度上的问题,Offline Explorer 不但提供了 HTTP 代理的设置,还提供了 FTP 代理的设置,考虑得非常周到。另外在 Tools 中还可设置扩展的网页浏览器、编辑器等。
1 r- e# ~1 Z; E0 \5 P本帖来源:网赚红利之家  http://www.gaminglistings.com
7 f: C5 ~( w+ j本帖来源:网赚红利之家  http://www.gaminglistings.com供了 FTP 代理的设置,考虑得非常周到。另外在 Tools 中还可设置扩展的网页浏览器、编辑器等。

TOP

发新话题