如果我们从搜索引擎蜘蛛的角度去看待一个网站,在抓取、索引和排名时会遇到哪些问题呢?解决了这些问题的
网站设计就是搜索引擎友好的。
- 搜索引擎蜘蛛能不能找到网页
要让搜索引擎发现网站首页,就必须要有
外部链接练到首页,找到目标后,蜘蛛沿着
内部链接找到更深的内容页。所以要求网站要有良好的结构,符合逻辑,并且所有页面可以通过可爬行的普通HTML链接到达。JavaSricpt链接、Flash中的链接等搜索引擎蜘蛛一般不能跟踪爬行,就会造成收录问题。
网站所有页面点击距离不能太远,最好是在四、五次点击之内。要被搜索引擎收录,页面需要有最基本的权重,良好的网站链接结构可以适当传递权重,使尽可能多的网页达到收录门槛。
2.找到网页后能不能抓取页面类容
被发现的URL必须是可以被抓取的,数据库动态生成、带有过多参数的URL、SessionID、整个页面是Flash、框架结构(frame)、可疑的转向、大量复制内容等可以使搜索引擎敬而远之。
某些文件站站长可能不希望被收录,除了不链接这些文件,更保险的方法是使用robots文件或meta robots标签禁止收录。
3.抓取页面后怎样提炼有用信息
关键词在页面重要位置合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可以帮助搜索引擎理解页面内容,提取有用信息。
只有搜索引擎能顺利找到所有网页,抓取这些页面并提取出其中真正有相关性的内容,网站才可以被视为搜索引擎友好的。
网上搜索引擎不友好的网站比比皆是,尤其是一些中小企业网站。
分享文章:什么是对搜索引擎设计友好的网站?
链接分享:
http://cdxtjz.cn/article/sgcjsc.html