看一条蜘蛛爬行的记录吧:
•2016-05-27 16:03:09 123.125.71.41- GET /design_net/index.asp 200 0 HTTP/1.1Baiduspider+(+) –
•爬行记录是用空格来隔开每个参数的,它们分别代表:日期 时间 来访IP 用户 方式 受访地址 状态 字节数 HTTP版本 客户端 来访地址。
SEO过程中最常见的HTTP状态码有:
200- 服务器成功返回网页
404- 请求的网页不存在
503- 服务器错误
域名后缀以.com为最好,符合大多数用户的习惯。普遍认为.edu与.gov较有优势,但不是天生的。域名中的关键词有助于关键词排名,域名的长度越短越好,域名的历史不要被搜索引擎惩罚过,品牌优先,域名中不建议使用连词符,如使用尽量使用“-”。
爬虫服务器和网站服务器一定要稳定并且速度要快,当你的网站连续或者间断出现不稳定情况时,搜索引擎会暂时对你的网站进行降权处理,直至你的网站服务器恢复正常后3-7天,甚至会导致网站被搜索引擎降权,更长的时间才能恢复。
如果同一IP下有一个网站作弊,有可能会对你网站带来负面影响。用同一IP下的网站做交叉链接有可能被视为作弊。
合理的网站结构应为扁平的树型网状结构,树型结构分为多个二级目录或者频道页,每个页面放到相应的二级目录或者频道页面下,也可再细化;扁平式的结构,所有页面都放在根目录下,适合小型网站。树状结构按照目录或者是频道这样以层次为基准链接结构,可以方便权重更好的传递。网站的所有页面都要能从主页开始,顺着链接找到,最好在3,4次点击之内。
url要尽量短,以静态页面为主,不要使用动态url。目录的层次要尽可能少,尽量保持在4层以内。url中最好包含关键词(关键词为英文)。字母尽量全部小写,连字符最好使用横线(-),URL具有唯一性。
关键字出现的位置遵循自左上向下策略:
Title:网站首页包含核心关键词,以“页面标题-栏目标题-首页”形式,不可过长,内页标题不要超过30个汉字。
keywords:key1,key2……
Description:描述标签对文章的点击率有很大的关系,好的标签可以吸引客户眼球,同时标签的字数不易太长,标点使用半角格式,在前50和字中最好出现关键词。
图片注释:
<imgsrc=“1.jpg” alt=“key1”/>
超链接:使用关键字作为连接的文本,而不直接给出链接地址。
关键词密度:需要保持在2%~8%上,内部链接及锚文字,每个文章中不能超过3个锚文字,一定要多样性。页面更新需要有一定的规律,内容写作上要有一定的层次,攻略性文章最好简明扼要,条理清晰,最好不要出现一大片文字堆积的现象,同时,对于文章中的标题可以使用黑体加粗。
内容的持续更新是网站生存和发展的根本,无论是用户还是搜索引擎,均不可能对一个长期不更新的网站投入过多的关注,抛弃这类“死站”或“准死站”只是一个时间问题。网站更新频率与搜索引擎的访问频率成正比。