搜索引擎爬虫列表
作者:admin 日期:2009-08-14
搜索引擎是人们再熟悉不过的工具,它将Internet上的信息索引起来,方便人们在海量数据中迅速查找有用的信息。而搜索引擎公司,国外以 Google为代表,国内以百度为代表,成为互联网上举足轻重的公司,其访问量也远远超过传统门户网站,成为网民最离不开的网络服务。而遇到问题 “Google一下”或者“百度一下”也成为人们日常生活中的习惯。
而对于网站建设者而言,也会经常与搜索引擎打交道,这就是Search Engine Spiders(网络爬虫,或者叫搜索引擎蜘蛛,网页爬取机器人等)。这些Spider爬虫蜘蛛会经常光顾各个网站,将网站上的最新内容爬取下来,并编入索引库中。以下是一些常见的搜索引擎蜘蛛列表:
高强度爬虫程序
Baiduspider+(+http://www.baidu.com/search/spider.htm)
百度爬虫
高强度爬虫,有时会从多个IP地址启动多个爬虫程序!
由于算法问题,百度爬虫对相同页面会多次发出请求(尤其是首页),令人烦恼。
推广效果好。
怎么发帖可以让搜索引擎(百度)尽快收录?
作者:admin 日期:2009-08-01
帖子的内容需要注意的要点:
1、内容中需要带有站点的名称,并把这个站点的名称作为文字链接,连向你的主域名。如:思缘软件&网络 。这个概念叫:Anchor Text,中文:链接锚文本
2、一个细节请注意,文字链接的地址需要带着http://,如:http://www.cnsysoft.com 而不是简单的 www.cnsysoft.com
3、不要把网站的名称作为帖子的标题发表。造成的结果是,你的帖子将来会成为你的竞争对手,甚至影响你的网站(企业)形象。百度搜索一下一些企业的名称,发现搜索结果里面摆在前几位的很多是这个企业的招聘信息,如深圳××建材有限公司招聘××,而自己的企业网站却摆在后面去了。
搜索引擎对SEO作弊的判定条件
作者:admin 日期:2009-07-26
SEO作弊方式有很多种形式,比如:域名轰炸、弹出新窗口转向、制作Link Farm-链接养殖场等等。对于SEO作弊,搜索引擎公开的判定条件如下:
百度对作弊的判定条件
- 在网页源代码中任何位置,故意加入与网页内容不相关的关键词。
- 在网页源代码中任何位置,故意大量重复某些关键词。即使与网页内容相关的关键词,故意重复也被视为作弊行为。
- 在网页中加入搜索引擎可识别但用户看不见的隐藏文字。无论是使用同背景色文字、 超小字号文字、文字隐藏层、还是滥用图片ALT 等方法,都属于作弊行为。
- 故意制造大量链接指向某一网址的行为。
- 对同一个网址,让搜索引擎与用户访问到不同内容的网页(包括利用重定向等行为)。
- 作弊行为的定义是针对网站而不是网页的。一个网站内即使只有一个网页作弊,该 网站也被认为是有作弊行为。
几大搜索引擎的网站登录入口
作者:admin 日期:2009-07-25
以下是登录几个重要搜索引擎的网站登录入口地址:
百度:http://www.baidu.com/search/url_submit.html
Google:http://www.google.com/intl/zh-CN/add_url.html
中国雅虎:http://search.help.cn.yahoo.com/h4_4.html
微软Live&Msn:http://search.msn.com.cn/docs/submit.aspx
