2023年12月18日发(作者:)

HTTP

1xx-信息提示 这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。

100-继续。

101-切换协议。

2xx-成功 这类状态代码表明服务器成功地接受了客户端请求。

200-确定。客户端请求已成功。

201-已创建。

202-已接受。

203-非权威性信息。

204-无内容。

205-重置内容。

206-部分内容。

3xx-重定向 客户端浏览器必须采取更多操作来实现请求。例如,浏览器可能不得不请求服务器上的不同的页面,或通过代理服务器重复该请求。

301-对象已永久移走,即永久重定向。

302-对象已临时移动。

304-未修改。

307-临时重定向。

4xx-客户端错误 发生错误,客户端似乎有问题。例如,客户端请求不存在的页面,客户端未提供有效的身份验证信息。

400-错误的请求。

401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示:

401.1-登录失败。

401.2-服务器配置导致登录失败。

401.3-由于ACL对资源的限制而未获得授权。

401.4-筛选器授权失败。

401.5-ISAPI/CGI应用程序授权失败。

401.7-访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。

403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:

403.1-执行访问被禁止。

403.2-读访问被禁止。

403.3-写访问被禁止。

403.4-要求SSL。

403.5-要求SSL128。

403.6-IP地址被拒绝。

403.7-要求客户端证书。

403.8-站点访问被拒绝。

403.9-用户数过多。

403.10-配置无效。

403.11-密码更改。

403.12-拒绝访问映射表。

403.13-客户端证书被吊销。

403.14-拒绝目录列表。

403.15-超出客户端访问许可。

403.16-客户端证书不受信任或无效。

403.17-客户端证书已过期或尚未生效。

403.18-在当前的应用程序池中不能执行所请求的URL。这个错误代码为IIS6.0所专用。

403.19-不能为这个应用程序池中的客户端执行CGI。这个错误代码为IIS6.0所专用。

403.20-Passport登录失败。这个错误代码为IIS6.0所专用。

404-未找到。

404.0-没有找到文件或目录。

404.1-无法在所请求的端口上访问Web站点。

404.2-Web服务扩展锁定策略阻止本请求。

404.3-MIME映射策略阻止本请求。

405-用来访问本页面的HTTP谓词不被允许(方法不被允许)

406-客户端浏览器不接受所请求页面的MIME类型。

407-要求进行代理身份验证。

412-前提条件失败。

413-请求实体太大。

414-请求URI太长。

415-不支持的媒体类型。

416-所请求的范围无法满足。

417-执行失败。

423-锁定的错误。

5xx-服务器错误 服务器由于遇到错误而不能完成该请求。

500-内部服务器错误。

500.12-应用程序正忙于在Web服务器上重新启动。

500.13-Web服务器太忙。

500.15-不允许直接请求。

500.16-UNC授权凭据不正确。这个错误代码为IIS6.0所专用。

500.18-URL授权存储不能打开。这个错误代码为IIS6.0所专用。

500.100-内部ASP错误。

501-页眉值指定了未实现的配置。

502-Web服务器用作网关或代理服务器时收到了无效响应。

502.1-CGI应用程序超时。

502.2-CGI应用程序出错。application.

503-服务不可用。这个错误代码为IIS6.0所专用。

504-网关超时。

505-HTTP版本不受支持。

FTP

1xx-肯定的初步答复 这些状态代码指示一项操作已经成功开始,但客户端希望在继续操作新命令前得到另一个答复。

110-重新启动标记答复。

120-服务已就绪,在nnn分钟后开始。

125-数据连接已打开,正在开始传输。

150-文件状态正常,准备打开数据连接。

2xx-肯定的完成答复 一项操作已经成功完成。客户端可以执行新命令。

200-命令确定。

202-未执行命令,站点上的命令过多。

211-系统状态,或系统帮助答复。

212-目录状态。

213-文件状态。

214-帮助消息。

215-NAME系统类型,其中,NAME是AssignedNumbers文档中所列的正式系统名称。

220-服务就绪,可以执行新用户的请求。

221-服务关闭控制连接。如果适当,请注销。

225-数据连接打开,没有进行中的传输。

226-关闭数据连接。请求的文件操作已成功(例如,传输文件或放弃文件)。

227-进入被动模式(h1,h2,h3,h4,p1,p2)。

230-用户已登录,继续进行。

250-请求的文件操作正确,已完成。

257-已创建"PATHNAME"。

3xx-肯定的中间答复 该命令已成功,但服务器需要更多来自客户端的信息以完成对请求的处理。

331-用户名正确,需要密码。

332-需要登录帐户。

350-请求的文件操作正在等待进一步的信息。

4xx-瞬态否定的完成答复 该命令不成功,但错误是暂时的。如果客户端重试命令,可能会执行成功。

421-服务不可用,正在关闭控制连接。如果服务确定它必须关闭,将向任何命令发送这一应答。

425-无法打开数据连接。

426-Connectionclosed;transferaborted.

450-未执行请求的文件操作。文件不可用(例如,文件繁忙)。

451-请求的操作异常终止:正在处理本地错误。

452-未执行请求的操作。系统存储空间不够。

5xx-永久性否定的完成答复 该命令不成功,错误是永久性的。如果客户端重试命令,将再次出现同样的错误。

500-语法错误,命令无法识别。这可能包括诸如命令行太长之类的错误。

501-在参数中有语法错误。

502-未执行命令。

503-错误的命令序列。

504-未执行该参数的命令。

530-未登录。

532-存储文件需要帐户。

550-未执行请求的操作。文件不可用(例如,未找到文件,没有访问权限)。

551-请求的操作异常终止:未知的页面类型。

552-请求的文件操作异常终止:超出存储分配(对于当前目录或数据集)。

553-未执行请求的操作。不允许的文件名。

常见的FTP状态代码及其原因:

150-FTP使用两个端口:21用于发送命令,20用于发送数据。状态代码150表示服务器准备在端口20上打开新连接,发送一些数据。

226-命令在端口20上打开数据连接以执行操作,如传输文件。该操作成功完成,数据连接已关闭。

230-客户端发送正确的密码后,显示该状态代码。它表示用户已成功登录。

331-客户端发送用户名后,显示该状态代码。无论所提供的用户名是否为系统中的有效帐户,都将显示该状态代码。

426-命令打开数据连接以执行操作,但该操作已被取消,数据连接已关闭。

530-该状态代码表示用户无法登录,因为用户名和密码组合无效。如果使用某个用户帐户登录,可能键入错误的用户名或密码,也可能选择只允许匿名访问。如果使用匿名帐户登录,IIS的配置可能拒绝匿名访问。

550-命令未被执行,因为指定的文件不可用。例如,要GET的文件并不存在,或试图将文件PUT到您没有写入权限的目录。

一个网站的各大搜素引擎日志分析如下

日志中的HTTP状态码都代表什么?

作SEO时,我们经常会在日志上看到类似这样的代码:

61.135.166.232 - - [31/Dec/2007:02:30:11 +0800] "GET /

HTTP/1.1" 200 10968 "-"

"Baiduspider+(+/search/)"

66.249.70.172 - - [31/Dec/2007:03:36:10 +0800] "GET /32_10_

HTTP/1.1" 200 18395 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;

+/)"

这里面需要知道的,就是那个奇怪的数字“200”(另外那个数字表示抓取的文件大小)。

“200”就是HTTP状态码。

SEO过程中最常见的HTTP状态码有:

? 200 - 服务器成功返回网页

? 404 - 请求的网页不存在

? 503 - 服务器超时

其他经常碰到的HTTP状态码列表如下:

HTTP状态码 摘要说明

________________________________________

成功2×× 成功处理了请求的状态码。

200 服务器已成功处理了请求并提供了请求的网页。

204 服务器成功处理了请求,但没有返回任何内容。

重定向3×× 每次请求中使用重定向不要超过 5 次。

301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。搜索引擎索引中保存新的URL。

302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。

304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。

客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。

400 服务器不理解请求的语法。

403 服务器拒绝请求。

404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。

410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。

服务器错误5×× 表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。

500 服务器遇到错误,无法完成请求。

503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。

一、网站日志文件在哪里?

【简单说下网站虚拟主机FTP几个文件夹说明】

虚拟主机开通成功之后,会在您的FTP里面自动生成4个文件夹,分别是:"databases","logofiles","others","wwwroot",他们作用如下:

1、wwwroot文件夹:该文件夹内存放可以通过web访问的文件,您需要将您对外发布的网站文件上传到该目录下,输入域名访问到的文件将是该文件夹下的文件。

2、databases文件夹:该文件夹同logofiles、others文件夹一样,属于不可通过web访问的文件夹,即用户无法通过输入网址来访问这些文件夹下的文件,您可以在这些文件夹下上传一些不希望别人能够访问的文件。比如您可以将access数据库存放在databases文件夹下,这样可以最大化的保证您的数据库安全。

3、logofiles文件夹:logofiles文件夹是日志文件,该文件夹存放您的网站日志文件。通过日志文件您可以查询到网站的一些访问记录。(由于各个空间商的不同,本文件夹的命名也有少许差别有都命为:logofiles或者WEBLOG反正一般都会带上LOG这一个字母)

4、others文件夹:该站点存放您自定义的IIS错误文件。IIS默认的一些错误提示,比如404错误,403错误,500错误等等,如果您觉得这些错误提示不够个性化,您可以将您自定义的错误提示上传到该目录下。

二、怎样分析网站日志文件 分析举例说明

下面已IBM笔记本电脑论坛最近8月份的日志文件为例说明一下,空间日志代码如下:

2009-08-23 16:06:03 W3SVC176 58.61.160.170 GET

/nb/html/30/ - 80 - 220.181.7.24

Baiduspider+(+/search/) 200 0 0 20006

1、首先以百度为例,分析说明:

访问时间:2009-08-23 16:06:03

百度蜘蛛的IP:58.61.160.170

蜘蛛爬这的网址: /nb/html/30/

合来起所表达的意思很明显:IP为58.61.160.170的百度蜘蛛在2009-08-23

16:06:03点43分对此网站上的/nb/html/30/ 网页进行收录或更新了。

【补充说明】

2009-08-23 16:06:03是百度蜘蛛来访的日期及时间;

158.61.160.170 是百度蜘蛛的IP

“GET 是服务器的动作,不是GET就是POSP;GET是从服务器上获取内容;/nb/html/30/ 使用HTML1.1协议获取相关内容200 是返回状态码,200是成功获取;404是文件没找到;401是需要密码,403禁止查看,500服务器错误。很明显此例子中最后返回是200,为成功获取!

“+(+/search/)″表示来路

当然,还有部分空间日志会有这样一些代码,他们表示意思如下:

“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa

Toolbar)” 表示的是用户所使用的电脑是与Netscape兼容的Mozilla浏览器,Windows NT操作系统,浏览器是IE6.0,装有Alexa Toolbar。

2、接下来说说googlebot,我盼googlebot已经好久了,这几天它终于来了,然后我在上输入site:,果然看到了收录文件的更新。

2009-08-23 00:07:20 66.249.65.116 - 218.85.132.68 80 GET

/html/down/20070129/ - 200

Mozilla/5.0+(compatible;+Googlebot/2.1;++/)

218.85.132.68查此IP直接给了结果“美国 GoogleBot 搜寻引擎机器人”,呵呵,goolgebot真出名,也很规范。

3、Yahoo也要说说的:

2009-08-23 00:04:45 202.160.178.195 - 218.85.132.68 80 GET

/html/ad/20070131/ - 200

Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+/)

查IP得知是雅虎中国,Yahoo!+Slurp+China是雅虎蜘蛛名,以前是Inktomi

Slurp;想查询网站在yahoo的收录情况与google和百度不同的是,你直接在上输入网址即可。不用加前缀site:,还有一点,觉得这几个月的雅虎中国在技术上有改进,在网站收录和关键词搜索上,大家可以自己去体会。

说完三大搜索爬虫,再来看看别的二流搜索引擎的爬虫及门户搜索的爬虫:

1)msn: msn(msn live search beta)的搜索技术我个人觉得是难入流的,似乎比门户搜索更差,beta说明搜索版在测试阶段,现在电信采用msn的搜索技术,不知道电信的是什么眼光,呵呵。

2009-08-23 08:22:15 65.55.213.7 - 218.85.132.68 80 GET

/html/down/20070129/ - 200

msnbot-media/1.0+(+/)

2)Alexa:大名鼎鼎的世界排名Alexa,它的蜘蛛比较难记,是ia_archiver。从严格意义上说,它不知道是不是爬虫,它与纯搜索引擎不同,是来侦测流量的居多,并不是来收录网页的。

2009-08-23 01:24:44 209.237.238.226 - 218.85.132.68 80 GET

/html/internet/20070130/ - 200 ia_archiver

3)Iask爱问:

2009-08-23 11:56:47 60.28.164.44 - 218.85.132.68 80 GET

/html/webpromote/20070203/ - 200

Mozilla/5.0+(compatible;+iaskspider/1.0;+MSIE+6.0)

4)sogou搜狗:

对于搜狗,我就觉得好笑了。大家记得我说过我的网站是改版过的,Brand是旧网站文件,早被我删除了。而且为了删除除搜索引擎收录的死链接,我在文件中写着:Disallow: /Brand ,这当然禁止访问Brand下的文件,我这里想说的是,一、它sogou不遵守robots协议,二、对于已经删除近一个月的文件,它从哪里搜索而来。我真的不太明白了。

2009-08-23 01:34:42 220.181.19.170 - 218.85.132.68 80 GET /

404;/underwear/Brand/ 200 sogou+spider

5)yodaoice:

对于这个,大家不要感觉惊讶,这是163新开发的搜索引擎,目前处于测试版,界面颇象google风格,但技术年幼,也象搜狗一样乱抓一通。2009-08-23

06:19:29 60.191.80.151 - 218.85.132.68 80 GET /

404;/underwear/ 200 yodaoice

那么多爬虫盯上我的网站,一方面高兴的是就爱SEO论坛的发展还得靠它们,另一方面郁闷的是有些不按规则来抓的对网站的访问会有造成不良的影响。看看比前两周增长得多的日志文件就知道了。

这些只是SEO中常碰到的HTTP状态码,你可以到W3C站点了解更多