当前位置: 首页 > 网络学院 > 设计教程 > 搜索引擎优化 > 面向搜索引擎的URL设计

搜索引擎优化
Google 谬识与事实
网站排名软件的是是非非
百度与站长-使百度有效收录
搜索引擎优化的五大技术难题
PR更新总结
dmoz.org的网站选择标准
服务器对网站排名的影响
网站的信息更新频率应该是多少?
影响搜索引擎排名的77大因素
基于XHTML标准的DIV+CSS布局对于SEO的影响
搜索引擎优化(SEO)— 初学者指南[繁体]

搜索引擎优化 中的 面向搜索引擎的URL设计


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-03-01   浏览: 714 ::
收藏到网摘: n/a

不得不承认,将动态网页链接rewriting成静态链接是最保险和稳定的面向搜索引擎优化方式。

此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式。比如可以将:

http://phpunixman.sourceforge.net/index.php?mode=man&parameter=ls


变成:


http://phpunixman.sourceforge.net/index.php/man/ls

实现方式主要有2种:

基于url rewrite
IIS
ISAPI REWRITE下载(免费)

基于path_info
URI地址用作参数传递:URL REWRITE

最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:这样几乎可以不修改程序的实现将 news.asp?id=234 这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewriteURL REWRITE功能之强大足够写上一本书。

当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:
RewriteRule /news/(d+).html /news.asp?id=$1 [N,I]
这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234

而在IIS也有相应的REWRITE模块:比如ISAPI REWRITEIIS REWRITE,语法都是基于正则表达式,因此配置几乎和apachemod_rewrite是相同的:

比对于某一个简单应用可以是:
RewriteRule /news/(d+).html /news/news.php?id=$1 [N,I]
这样就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234

一个更通用的能够将所有的动态页面进行参数映射的表达式是:
http://www.myhost.com/foo.php?a=A&b=B&c=C
表现成 http://www.myhost.com/foo.php/a/A/b/B/c/C
RewriteRule (.*?.php)(?[^/]*)?/([^/]*)/([^/]*)(.+?)? $1(?2$2&:?)$3=$4?5$5: [N,I]

一下是真对phpBB的一个Apache mod_rewrite配置样例:
mod_rewrite
isapirewrite基本兼容,但是还是有些不同,比如:isapirewrite"?"需要转义成"?"mod_rewrite不用,isapirewrite支持 “d+” (全部数字),mod_rewrite不支持
RewriteEngine On
RewriteRule /forum/topic_(.+).html$ /forum/viewtopic.php?t=$1 [L]
RewriteRule /forum/forum_(.+).html$ /forum/viewforum.php?f=$1 [L]
RewriteRule /forum/user_(.+).html$ /forum/profile.php?mode=viewprofile&u=$1 [L]

这样设置后就可以通过topic_1234.html forum_2.html user_34.html这样的链接访问原来的动态页面了。

通过URL REWRITE还有一些好处:

隐藏后台实现:这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,根本感受不到后台应用的变化;
简化数据校验:因为像(d+)这样的参数,可以有效的控制数字的格式甚至位数;
比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。

基于PATH_INFOURL美化
Url
美化的另外一个方式就是基于PATH_INFO
PATH_INFO
是一个CGI 1.1的标准,经常发现很多跟在CGI后面的"/value_1/value_2″就是PATH_INFO参数:
比如http://phpunixman.sourceforge.net/index.php/man/ls,中:$PATH_INFO = “/man/ls”

PATH_INFO
CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foogetPathInfo()将返回的 /hello.jsp,从这里你也可以知道jsp其实就是一个ServletPATH_INFO参数。ASP不支持PATH_INFO

PHP
中基于PATH_INFO的参数解析的例子如下:
//
注意:参数按"/"分割,第一个参数是空的:从/param1/param2中解析出$param1 $param22个参数
if ( isset($_SERVER["PATH_INFO"]) ) {
list($nothing, $param1, $param2) = explode(’/', $_SERVER["PATH_INFO"]);
}

如何隐蔽应用:例如 .php,的扩展名:
APACHE中这样配置:ForceType application/x-httpd-php

如何更像静态页面:app_name/my/app.html
解析的PATH_INFO参数的时候,把最后一个参数的最后5个字符“.html”截断即可。
注意:APACHE2中缺省是不允许PATH_INFO的,需要设置AcceptPathInfo on

特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往就成了唯一的选择。

OK
,这样以后看见类似于http://www.example.com/article/234这样的网页你就知道可能是 article/show.php?id=234这个php程序生成的动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用12个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的wiki程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。

利用基于MOD_REWRITE/PATH_INFO CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录入索引。
附:如何在IIS上利用PHP支持PATH_INFOPHPISAPI模式安装备忘:只试成 php-4.2.3-Win32

解包目录
========
php-4.2.3-Win32.zip c:php

PHP.INI
初始化文件
=================
复制:c:phpphp.ini-dist c:winntphp.ini

配置文件关联
============
按照install.txt中的说明配置文件关联

运行库文件
==========
复制 c:phpphp4ts.dll c:winntsystem32php4ts.dll

这样运行后:会发现phpPATH_INFO映射到了物理路径上
Warning: Unknown(C:CheDongDownloadsariadnewwwtest.phppath): failed to create stream: No such file or directory in Unknown on line 0

Warning: Unknown(): Failed opening ‘C:CheDongDownloadsariadnewwwtest.phppath’ for inclusion (include_path=’.;c:php4pear’) in Unknown on line 0

安装ariadnePATCH
==================
停止IIS服务
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆盖原有的c:phpsapiphp4isapi.dll

注:
ariadne
是一个基于PATH_INFO的内容发布系统,
PHP 4.3.2 RC2
CGI模式的PATH_INFO已经修正,照常安装即可。

参考资料:
URL Rewrite
文档:
ISAPI REWRITE
文档
IIS
ISAPI REWRITE下载(免费)
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html

搜索引擎友好的URL设计,http://www.sitepoint.com/article/485说不定这个URL原来就是articel.php?id=485

一个基于PATH_INFO的开源内容管理系统,http://typo3.com/

Google
PageRank算法说明:http://pr.efactory.de/

 

评论 (0) All

登陆 | 还没注册?