s5
职业顶帖手
级别: 博士生
UID: 32
精华: 0
发帖: 103
威望: 121 点
积分转换
愚愚币: 37 YYB
在线充值
贡献值: 0 点
在线时间: 182(小时)
注册时间: 2006-06-15
最后登录: 2010-01-31
楼主  发表于: 2006-09-03 12:22

 一个从国外论坛学来的代理搜索式+应用于代理吸附之技巧实例

管理提醒: 本帖被 lou1984 从 文献检索知识 移动到本区(2010-04-08)
一个从国外论坛学来的代理搜索式+应用于代理吸附之技巧实例

""*.*.*.*.*:80" "*.*.*.*.*:8080" "*.*.*.*.*:3128""

以上搜索式060224验证已被GOOGLE屏蔽,更换:
***.***.***:80 ***.***.***:8080 ***.***.***:3128
以上在搜索引擎中跑一下,会有不少的发现。如果结合FLASHGET+MGICFILTER可以吸不少的代理。
这是从http://www.securibox.net 上学来的,试用了一下,还可以。可以玩玩。


10.05 21:34 增补信息,写得太烦了,仅供新手参考:

再补一个搜索式(其实还有其他很多,大家可以借此开拓一下思路):
+":8080" +":3128" +":80" filetype:txt
来源:http://johnny.ihackstuff.com

吸附代理应用实例:
1.YAHOO的高级检索:
http://search.yahoo.com/search/options?fr=fp-top&p=
设置:Number of ResultsDisplay 100
搜索:""*.*.*.*.*:80" "*.*.*.*.*:8080" "*.*.*.*.*:3128""

2.利用:
(1)FLASHGET+MAGICFILTER吸取代理:
1)右键:选用网际快车下载全部链接
点击URL排序,只下载以开头的链接:http://rds.yahoo.com/;_ylt=(说明:下载什么链接的具体选择什么要自已体会一下,当然你也可选别的,但文件名More from this site - Save - Block,这三是不要选的)
确定下载。

2)下载完成后当然是用MAGICFILTER过滤出PROXIES就可以了。
第一页经处理,有4400余枚代理

注意:网际快车下载时,因为搜索引擎常不支持多线程下载,对YAHOO,建议采用单线程,重试次数大于3。

(2)也可以用ZLEECHER来吸附URLS,有朋友在我的ZLEECHER软件提供的后面总要我写一个说明,我想在我写的一篇关如何查找MDCONSULT免费入口的文章中已有利用这个软件来制作吸附列表的提法。这个软件小巧,还是可以利用。具体的如何吸URLS见我的那篇文章。

这里的步骤:
MYIE2的查看,页面链接,选择链接网址包含:http://rds.yahoo.com/;_ylt= 网址(利用网际快车如上也可以得到这些网址,这些网址含YAHOO的跳转地址,需要把它们滤掉)粘入一个文本文件,用ZLEECHER滤出URLS,这时就得到我们要的网址了。

以下是我从第十页中过滤下来的,如果你没有过滤到我的数目,你的方法就有问题。实践很重要。
当然这个URLS的网址不全是代理吸附地址,还要PROXYLEECH等过滤。

http://216.109.125.130/search/ca ... mp;ei=utf-8&va=
http://aliahmad453.persianblog.com/
http://ant.h100.ru/pipermail/howtousethewebserver.htm
http://az.ru/tophacker/proxy.htm
http://baltenergogn.front.ru/kronasib.html
http://bigsenhas.blogspot.com/
http://ccproxy.fjtc.edu.tw/cache-stats/2002
http://checker.freeproxy.ru/filter_lite
http://content.mail.ru/arch/2735/164269.html
http://contribs.org/contribs/rmi ... /howto/dansguardian
http://corabonna.blogspot.com/
http://demarkra.front.ru/
http://epidem.ru/modules.php?nam ... ew&news_id=3126
http://forums.searchenginewatch.com/showthread.php?t=1909
http://jeepee.biz/proxyworld/infopages/4
http://jeremy.chartier.free.fr/snortalog/report.txt
http://kadets.ru/part4/page39
http://linuxportal.ru/entry.php/81_0_3_0_c
http://mobiraol.front.ru/panart/korund.html
http://money2you.narod.ru/proxy1.htm
http://motd.webchat.org/tur.html
http://news.search.yahoo.com/news/search?p=
http://people.debian.org/
http://peru.indymedia.org/mail.php?id=12804
http://phplabs.com/scripts.php?script=portpeeker
http://proxydetect.com/
http://qb5.2ch.net/test/read.cgi/operate/1104339319
http://rds.yahoo.com/
http://rezamosh.persianblog.com/1382_12_rezamosh_archive.html
http://search.yahoo.com/preferences/preferences?pref_done=http
http://search.yahoo.com/search/dir?p=
http://search.yahoo.com/search?_adv_prop=web&ei=utf-8&va=
http://search.yahoo.com/search?p=
http://search.yahoo.com/web/adva ... mp;ei=utf-8&va=
http://shakh.blogfa.com/
http://shopping.yahoo.com/search?p=
http://ss-ss.persianblog.com/
http://stayinvisible.sg5.biz/
http://svden.chat.ru/
http://ukha.h100.ru/squid-users/000647.html
http://uug.byu.edu/pipermail/uug-list/2003-april/002060.html
http://vahid22.persianblog.com/
http://www.abouty.persianblog.com/
http://www.borderware.com/support/archive/1999/sep/msg00072.html
http://www.bsoft.ru/modules.php? ... rticle&sid=1274
http://www.cert-in.org.in/knowledgebase/whitepapers/openproxy.htm
http://www.cnn.com/tech/computin ... an.trojan.horse.idg
http://www.computergames.ro/forum/showthread.php?t=65909
http://www.exzilla.net/docs/proxy/javaproxy01.php
http://www.flourish.org/webmask/help/howto/explanation.html
http://www.freeproxyserverlist.com/
http://www.fz-juelich.de/zam/sicherheit/warnungen/news/mydoom.htm
http://www.geek.com/news/geeknews/oct99/gn19991022000205.htm
http://www.hackerslegion.com/tutorials/3.php
http://www.hackingballz.com/lista_proxys_anonimos/8
http://www.httrack.com/src/htscatchurl.c
http://www.i-hacked.com/index.ph ... task=view&id=54
http://www.irc.org/mla/ircd-users/2003/msg00176.html
http://www.jcu.edu.au/webalizer/elibrary/url_200406.html
http://www.knowplace.org/pipermail/narc/2002/000151.html
http://www.linux.cz/lists/archive/linux/19554.txt
http://www.linux.cz/lists/archive/linux/19590.txt
http://www.linux-magazine.com/issue/25/charly.pdf
http://www.momosh.com/mamo
http://www.neckar-alb-online.de/logfiles/agents.html
http://www.nightclub.blogfa.com/
http://www.opennet.ru/tips/info/385.shtml
http://www.pcinpact.com/forum/sujet_45931.htm
http://www.persianblog.com/?date=13830426&blog=lenz
http://www.proxy-web.com/proxy-list/tw
http://www.rebellog.com/text/pc/pc03-5.htm
http://www.rwetas.com/index.php?showtopic=193
http://www.talkaboutspam.com/group/alt.spam/messages/84276.html
http://www.thaimisc.com/r/print.php?id=458
http://www.tma.dk/ipfw.asp
http://www.unicom.com/sw/pxytest
http://www.unix.org.ua/squid/faq-5.html
http://www.vulnerabilite.com/dossier?page_num=1&id=14
http://www.webservertalk.com/message841802.html
http://www.zanet.org.za/servers
http://www.zdnet.co.uk/print?typ ... 39020375t-10000025c
http://www.zizigolopc.persianblog.com/
http://wwwcache.ed.ac.uk/stats/2003/01/23.html
http://wwww.clarkconnect.com/wik ... modules_-_web_proxy
http://yp.search.yahoo.com/search/ypredirect?p=


PROXYLEECH过滤去除吸附失败的与低于10个代理的后的”有效”代理吸附列表:

http://aliahmad453.persianblog.com/|0
http://ant.h100.ru/pipermail/howtousethewebserver.htm|0
http://baltenergogn.front.ru/kronasib.html|0
http://content.mail.ru/arch/2735/164269.html|0
http://demarkra.front.ru/|0
http://epidem.ru/modules.php?nam ... &news_id=3126|0
http://forums.searchenginewatch.com/showthread.php?t=1909|0
http://kadets.ru/part4/page39|0
http://mobiraol.front.ru/panart/korund.html|0
http://money2you.narod.ru/proxy1.htm|0
http://rezamosh.persianblog.com/1382_12_rezamosh_archive.html|0
http://shakh.blogfa.com/|0
http://ss-ss.persianblog.com/|0
http://svden.chat.ru/|0
http://ukha.h100.ru/squid-users/000647.html|0
http://vahid22.persianblog.com/|0
http://www.computergames.ro/forum/showthread.php?t=65909|0
http://www.exzilla.net/docs/proxy/javaproxy01.php|0
http://www.hackingballz.com/lista_proxys_anonimos/8|0
http://www.jcu.edu.au/webalizer/elibrary/url_200406.html|0
http://www.persianblog.com/?date=13830426&blog=lenz|0
http://www.proxy-web.com/proxy-list/tw|0
http://www.tma.dk/ipfw.asp|0
http://www.zizigolopc.persianblog.com/|0
http://wwwcache.ed.ac.uk/stats/2003/01/23.html|0

以上二种方法练熟了,可以互补应用。这两种方法都要实践,看是看不会的,按思路过一遍会有所收获
分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。