太原飞扬动力网站建设logo

致力于企业品牌

形象建设和传播

专注太原网站建设及推广    电话:133-1343-5212   :94589848    
网站首页 关于我们 网站建设 网站推广 服务报价 成功案例 新闻资讯 联系方式

太原做网站公司就选飞扬动力

飞扬动力 推荐文章
· GPL抗辩成功——织梦 CMS
· 我国网络购物用户规模达9.15
· SSL证书是什么?SSL服务器
· 实习证明材料分享
· 网站对历史发布信息进行备份和查
· 粉丝数量超过1000的公众号无
太原网站制作首页 > 新闻中心 > 网站知识
搜索引擎收录原理简单分析
www.ty3w.com    2010-06-19 19:36:32   来源:飞扬动力    浏览次数:6541

  搜索引擎要知道你的网站内容,就需要去搜集资料。在Yahoo的创办初期,有许多编辑天天泡在网上,访问新站,然后搜集信息集合整理成序。当时的网站没有现在这么多,所以还能做的过来。而现在的新站的出现数量,老站的更新都是爆炸式的,靠人工是不可能完成这个任务的。所以搜索引擎的就设计了程序,派他们来做这些工作。

  探测器有许多种叫法,也叫crawler(爬行器)、spider(蜘蛛)、robot(机器人)。这些形象的叫法是描绘搜索引擎排除的蜘蛛机器人爬行在互联网上探测新的信息。Google把这种探测器称为Googlebot,百度叫做Baiduspiderr,MSN叫做,MSNbot,而Yahoo则叫slurp。这个探测器实际上是人们编制的计算机程序,由它不分昼夜地进入访问网站,摘取网站内容、标签、图片等。然后依照搜索引擎的算法给他们制定索引。所以,这里说一下,它不是“爬行”而是光速访问的。

  一个搜索引擎能够会同时派遣很多探测器。这些探测器或者从站长直接提交的URL去访问,或者由一个网络用户所装的搜索引擎工具栏(如Google工具栏)得知用户去的网站,或者是从一个网站中指向另一个站的链接过去。所以说探测器不一定是从网站的首页进入访问,为了引来搜索引擎就需要使用一些方法。

  但是,探测器对许多的网站是不能完整抓取的,这个大多是由于网站设计没有按照搜索引擎探测器的思路来进行优化。比如说,如果一个网页比较大,探测器也只能截取网页的首部,而且只能跟着少量的链接走。Google目前能够吸收100KB的文件,Yahoo相对多一些。这些都可以通过实验来测试。将一个搜索关键词放在一个很长的网页(约150KB)中的尾部。然后看Google的cache说这个网页只有100KB,很显然,有一部分没有抓取到。

  这个现象告诉我们网页的设计不要过大,过长。将一个较大的网页分为若干小的页面有以下几个好处。

  1.可以使网页容易被探测器抓取。

  2.更容易建立合理的站内链接关系。

  3.每个页面可以更加集中关键词的主题。

  4.减少服务器的负载。

  5.对用户来说,方便阅读。


网站建设成功案例
珠海居安房屋维修工程有限公司
山西聚龙岩棉板保温材料
Shanxi Y&D Flying Trading Co., Ltd
山西艾克电缆有限公司
昌吉市新鑫铁艺护栏加工厂
太原网站建设 网站知识最近更新
· SSL证书是什么?SSL服务器证书免费赠送 · 网站对历史发布信息进行备份和查阅的相关管理制度及执行情况
· IIS7禁止某个IP或IP地址范围访问网站的方法 · 什么是域名证书?有法律效用吗?
· 营销型网站必须具备的要素 · 泉州企业网站服务器放境外打不开怎么解决?
· 网站备案可能会被注销的八种原因 · 医院网站备案怎么弄?
· 创业者为什么应该先开发网站而不是App? · 什么是独立网站?独立站的优势是什么?
· 网站域名劫持的情况及解决办法 · 网站知识:如何区分ICP备案和ICP经营许可证?



关于我们
飞扬动力立足山西,面向全国,专注营销型网站建设与推广,以领先的网络营销实力,打造太原网站建设行业品牌。用良心做好服务,用实力做好质量!
联系我们

地址:太原市长风西街62号长风世纪广场C-1603

电话:0351-763 7101

QQ/微信:94589848

E-mail:c141@163.com


扫描二维码

关注我们的公众号

建站推广快速了解


建站推广热线

133 1343 5212


飞扬动力提供企业网站策划设计和维护推广等网站相关服务,通过网站真正实现网络成交!| 在线留言 | 所有产品 | 主业务:太原网站建设/太原网络推广

© 2005-2023 TY3W.COM | 山西美炫互动科技有限公司 版权所有 | 晋ICP备15003960号-5