|
|
楼主 |
发表于 2011-5-7 16:05:44
|
显示全部楼层
完整代码(需配合附件里的内容方可使用,请看文末的注意事项)配置文件内容示例(为了配合以上代码,配置文件必须放入指定目录下,请下载附件使用):
注意事项:
1.本代码需要wget.exe、wfr.exe和HtoX32c.exe的支持:wget下载网页、wfr对文件编码进行转换、HtoX32c转html为txt;附件已经包含所需的全部文件;
2.配置文件必须严格按照其中的说明进行整理,修改配置文件的路径必须在代码中做相应的更改;
3.读览天下网站中的“精选文章”,无需账号密码也可下载完整内容——当某天这条不成立的时候,配合账号密码才能使用本代码。
4.本文仅谈思路和原理,与读览天下网站类似的网站都可以用这个思路和原理来抓取文本。本人精力有限,不能针对众多网站一一编写代码,请自行修改代码来适应那些类似的网站。
分类下载读览天下的精选文章.rar
http://pan.baidu.com/share/link?shareid=4087843025&uk=1124163200 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?注册
×
评分
-
查看全部评分
|