驿路枫情-加拿大移民论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 3343|回复: 9

关于 "家园论坛" 针对搜索引擎进行优化的说明

[复制链接]
发表于 2004-8-27 12:22:22 | 显示全部楼层 |阅读模式
当前家园论坛论坛在搜索引擎上面的排名有可喜的变化.以"加拿大移民"作为关键字
baidu 排在 第1页
sohu 排在 第1页
sina 排在第1页
google,163 稍微从47页上升到41页

从外因来看, 论坛已经度过了刚开始最艰难的一段路程.在google排名上升乏力的原因主要是对网站内部索引的页面数目不多,只是索引了首页.加大网站内部页面在google里索引的页面数目是当前最核心的内容.

下面的优化就是基于这个目的. 呵呵,如果那一天,在google搜索 "加拿大移民 + FCH" 能够出来4,5个页面.论坛就可能能够恢复到澳际的荣光了.   

1) 删除对话ID
这是这个优化的核心部分.这意味着搜索引擎不需要在URl里加上对话ID来搜索网站.

2) 静态网页代替动态网页
这是非常非常重要的修改,很多搜索引擎喜欢静态页面而不是php页面,特别是页面后面带着很多变化的参数时.有的搜索引擎甚至根本不索引.这个修改还没有完成. 修改后,除了首页以外,首页以下的连接地址都可能要发生变化,因此可能会影响到大家以前收藏的连接.笨笨将在另外个地址仔细测试后评估转化的好处和可能并提前告诉大家.

3) 去掉首页和版面里"查看最近帖子的" 图标和连接,而用最近帖子的日期连接到帖子
原因如下:
a) 对搜索引擎来说文字连接比图片连接更有吸引力.
b) 文字连接不断变化(随着日期变化),这对搜索引擎有吸引力,而且能够对以时间为关键字搜索有利

4)去掉首页和版面里指向用户资料的连接
这是个页面评级的问题,尽管可能有些使用不方便.这样做的原因如下:
a)页面有太多连接可能会招来搜索引擎的惩罚
b)指向个人资料不是重点,绝大多数用户使用搜索引擎时很少关心个人资料

5) 删除首页的斑竹列表
同上,这使得页面的连接减少,并加大搜索引擎访问页面内容而不是个人资料的可能性.


6) 不登陆将看不到签名档
因为对搜索引擎来数这部分总是重复,这样帮助用户和搜索引擎专注于页面内容.
另外减少引出不被搜索引擎喜欢的连接的可能

7)- 21)
还有许多小选项修改,略过
回复

使用道具 举报

发表于 2004-8-27 13:39:25 | 显示全部楼层
    
真不错,得谢谢小熊,也谢谢大家!!!

    
希望这些改变能把排名进一步提前

    
以后有个人网站问题,得请教你了!

我以前用fch搜索过,真的能找到澳际哦,呵呵。。。希望以后是找到家园。

回复 支持 反对

使用道具 举报

发表于 2004-8-27 13:40:59 | 显示全部楼层
对了,需要大家伙怎么配合的,都会尽力的。
回复 支持 反对

使用道具 举报

发表于 2004-8-27 13:46:43 | 显示全部楼层
论坛中授予崇高荣誉的功能怎么没找到,笨笨能说明一下吗?

笨笨工作十分出色,在这夸奖夸奖。呵呵,但还任重道远。辛苦啦!     
回复 支持 反对

使用道具 举报

发表于 2004-8-27 16:58:08 | 显示全部楼层
辛苦辛苦!   

好象以前瞟过论坛怎么提升在google中排位得文章
呵呵 什么时候用google搜搜看
  
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-28 15:35:48 | 显示全部楼层
呵呵,谢谢两位至尊宝的捧场.
关于个人网站的技术问题,笨笨永远全力支持FCH.

谢谢hanhan,另外转贴一篇关于如何提高网站的Google页面等级(PR值)的文章,以便于笨笨日后有机会查阅    .

    无论是对普通网络冲浪者还是网站管理员来说,Google都是目前世界范围内最受欢迎的搜索引擎。它每天处理的搜索请求高达1.5亿次,几乎占全球所有搜索量的1/3。网络冲浪者对Google情有独钟,是由于Google所提供的快速搜索速度及高命中率搜索结果。这些都是基于Google的复杂文本匹配运算法则及其搜索程序所使用的Pagerank?系统(网页级别技术)。下面我们将向大家介绍Google的Pagerank?系统。

Google之所以受网站管理员和Internet媒体服务公司的欢迎,是由于它并非只使用关键词或代理搜索技术,而是将自身建立在高级的网页级别技术基础之上。别的搜索引擎提供给搜索者的是多种渠道得来的一个粗略的搜索结果,而Google提供给它的搜索者的则是它自己产生的高度精确的搜索结果。这就是为什么网站管理员会千方百计去提高自己网站在Google的排名。
  Google大受青睐的另一个原因就是它的网站索引速度。向Google提交你的网站直到为Google收录,一般只需两个星期。如果你的网站已经为Google收录,那么通常Google会每月一次遍历和更新(重新索引)你的网站信息。不过对于那些PR值(Pagerank)较高的网站,Google索引周期会相应的短一些。
  Google的索引/重新索引周期比大多数搜索引擎要短。这就允许网站管理员可以对网站的页面属性进行编辑修改,如网页标题、头几行文字内容、大字标题、关键字分布,当然了还有外部链接的数量。然后他们很快就可以发现对网页所做的这些更改是否成功。
  正因为Google如此受欢迎,你有必要知道Google的搜索引擎是如何工作的。如果不知道它是怎样决定你的排名,那么那些只是稍微熟悉Google排名运算法则的站点都会比你的排名位置要靠前。现在让我们来看一下Google的排名运算法则。
  Google的排名运算法则主要使用了两个部分,第一个部分是它的文字内容匹配系统。Google使用该系统来发现与搜索者键入的搜索词相关的网页;第二部分也是排名运算法则中最最重要的部分,就是Google的专利网页级别技术(Pagerank?)。
  我先来介绍一下如何使网站具有相关性,即文本内容匹配部分的运算法则:
  在搜索网站的关键字时,Google会对其标题标签(meta title)中出现的关键字给予较高的权值。所以你应当确保在你网站的标题标签中包含了最重要的关键词,即应围绕你最重要的关键词来决定网页标题的内容。不过网页的标题不可过长,一般最好在35到40个字符之间。
  众所周知,Google并不使用元标签(Meta Tags)如关键字或描述标签。这是由于在这些元标签中所使用的文字并不能为实际的访问者所看到。而且Google认为,这些元标签会被某些网站管理员用于欺诈性地放置一些与其网站毫不相干的热门关键词,并以此提高其网站对该不相干关键词的排名,从而以不正当的手段获得更多的访问者。
  这种不支持Meta Tags的特性,意味着Google将从一个网页的头几行文字内容来生成对一个网站的描述。也就是说,你最好把你的关键字或关键短语放到网页的上方,这样如果Google找到它们,就会相应提高你网站的相关性。一旦Google找不到这样相关的内容,那么你要花费很大的力气来让你页面的其它部分具有相关性。
  在决定一个网站的相关性时,Google也会考虑网页中正文内容的关键字密度(Keyword Density),所以你要确保在你的整个网页中贯穿出现了若干次关键词和关键短语。但是要记住“过犹不及”,6-10%的关键词密度为最佳。
  增加页面相关性的其它策略还包括:在标题内容中放入关键词,并尽可能对内容中出现的关键词进行加粗。Google现在也索引图片的ALT属性文字并计入相关性计算。所以在你的ALT属性中应包含关键词,来增加网站的相关性得分。
  增加页面相关性的最后一个技巧就是使你网站上的外部文字链接包含你的关键字。在外部文字链接中包含关键字可有效提高你的网站相关性得分(Google在其PageRank技术的描述中,亦提及在计算网页级别时会对该网站的外部链接进行分析并计入相关性)。
  在文字链接中应该包含多少关键字?这是个见仁见智的问题。不过我注意到有很多网站在他们的交换链接区域,已经提供了相应的文字链接内容。例如:“欢迎进行友情链接,并请使用如下代码建立至本网站的链接。”
上面我们介绍了Google如何计算网站的相关性,及如何增加网站相关性的一些有关知识。不过Google究竟使用什么方法来衡量一个网站的好坏呢?答案就是-Google的Pagerank?系统。
  PageRank取自Google的创始人Larry Page,它是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性。级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。
  在计算网站排名时,PageRank会将网站的外部链接数考虑进去。我们可以这样说:一个网站的外部链接数越多其PR值就越高;外部链接站点的级别越高(假如Macromedia的网站链到你的网站上),网站的PR值就越高。例如:如果ABC.COM网站上有一个XYZ.COM网站的链接,那么ABC.COM网站必须提供一些较好的网站内容,从而Google会把来自XYZ.COM的链接作为它对ABC.COM网站投的一票。你可以下载和安装Google的工具条来检查你的网站级别(PR值)。
  那么是不是说,一个网站的外部链接数越高(获得的投票越多), 这个网站就越重要,因而在用与其相关的关键词进行搜索时,它就会取得更高的排名呢?--大错特错。
  Google对一个网站上的外部链接数的重视程度并不意味着你因此可以不求策略地与任何网站建立连接。这是因为Google并不是简单地由计算网站的外部链接数来决定其等级。要是那样的话,所有网站管理员就只剩一件事情可做了-疯狂交换链接,尽可能获得最多的外部链接。Google是这样描述的:“Google不只是看一个网站的投票数量,或者这个网站的外部链接数量。同时,它也会对那些投票的网站进行分析。如果这些网站的PR值比较高(具有相当重要性),则其投票的网站可从中受益(亦具有重要性)。
  那么,是不是说对一个网站而言,它所拥有的较高网站质量和较高PR分值的外部链接数量越多就越好呢?-也不尽然。
  说它错是因为-Google的Pagerank系统不单考虑一个网站的外部链接质量,也会考虑其数量.比方说,对一个有一定PR值的网站X来说,如果你的网站Y是它的唯一一个外部链接,那么Google就相信网站X将你的网站Y视做它最好的一个外部链接,从而会给你的网站Y更多的分值。可是,如果网站X上已经有49个外部链接,那么Google就相信网站X只是将你的网站视做它第50个好的网站。因而你的外部链接站点上的外部链接数越多,你所能够得到的PR分值反而会越低,它们呈反比关系。
  说它对是因为-一般情况下,一个PR分值大于等于6的外部链接站点,可显著提升你的PR分值。但如果这个外部链接站点已经有100个其它的外部链接时,那你能够得到的PR分值就几乎为零了。同样,如果一个外部链接站点的PR值仅为2,但你却是它的唯一一个外部链接,那么你所获得的PR值要远远大于那个PR值为6,外部链接数为100的网站。
  这个问题现在看来好象越来越复杂了。不要紧,看看下面这个公式你就会完全理解了,只是需要一点数学知识。
  首先让我们来解释一下什么是阻尼因数(damping factor)。阻尼因素就是当你投票或链接到另外一个站点时所获得的实际PR分值。阻尼因数一般是0.85。当然比起你网站的实际PR值,它就显得微不足道了。现在让我们来看看这个PR分值的计算公式:
  PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
  其中PR(A)表示的是从一个外部链接站点t1上,依据Pagerank?系统给你的网站所增加的PR分值;PR(t1)表示该外部链接网站本身的PR分值;C(t1)则表示该外部链接站点所拥有的外部链接数量。大家要谨记:一个网站的投票权值只有该网站PR分值的0.85,而且这个0.85的权值平均分配给其链接的每个外部网站。
  设想一个名为akamarketing.com的网站,被链接至PR值为4,外部链接数为9的网站XYZ.COM,则计算公式如下:
  PR(AKA) = (1-0.85) + 0.85*(4/10)
  PR(AKA) = 0.15 + 0.85*(0.4)
  PR(AKA) = 0.15 + 0.34
  PR(AKA) = 0.49
  也就是说,如果我的网站获得一个PR值为4,外部链接数为9的网站的链接,最后我的网站将获得0.49的PR分值。
  再让我们看看如果我的网站获得的是一个PR分值为8,外部链接数为16的网站的链接,那么我将获得的PR分值将是:
  PR(AKA) = (1-0.85) + 0.85*(8/16)
  PR(AKA) = 0.15 + 0.85(0.5)
  PR(AKA) = 0.15 + 0.425
  PR(AKA) = 0.575
  上述两个例子表明,外部链接站点的PR值固然重要,该站点的外部链接数也是一个需要考虑的重要因素。
 好了,大家无须记住上面的公式,只要记住:在建设你自己网站的外部链接时,应尽可能找那些PR值高且外部链接数又少的网站。这样一来你网站上这样的外部链接站点越多,你的PR值就会越高,从而使得你的排名得到显著提升。
  不过,为使你的PR值得到提高,你最应该做的一件事情就是-向DMOZ提交你的网站,从而为DMOZ,即ODP(开放目录专案)收录。
  众所周知,Google的Pagerank?系统对那些门户网络目录如DMOZ,Yahoo和Looksmart尤为器重。特别是对DMOZ。一个网站上的DMOZ链接对Google的Pagerank?来说,就好象一块金子一样有价值。这时候收录该网站的那个DMOZ目录页的PR分值,也变得无足轻重了。我就看到过有一些站点,就因为被ODP所收录,从而身价倍增,其PR分值在Google上立即得到提升。这就是因为Google使用了它自己的ODP版本作为它的网站目录。
  ODP的链接对Pagerank?非常重要。如果你的网站为ODP收录,则可有效提升你的页面等级。不信吗?
  确实如此。在Google上随便找个词搜索,你会发现,Google所提供的搜索结果的头10个站点中,就有7到8个也同时在Google的目录中出现。这个事实足以说明,如果一个网站没有被ODP收录的话,那它也别指望能从Google上得到太多的访问量。
  向ODP提交你的站点并为它收录,其实并不是一件难事,只是要多花点时间而已。只要确保你的网站提供了良好的内容,然后在ODP合适的目录下点击“增加站点”,按照提示一步步来就OK了。至少要保证你的索引页(INDEX PAGE)被收录进去。我说“至少”是因为尽管ODP声称他们只收录你的索引页,而事实上在ODP上却不乏被收录了5到10页的网站。所以,如果你的网站内容涉及完全不同的几块内容,你可以把每个内容的网页分别向ODP提交-不过请记住“欲速则不达”。等到Google对其目录更新后,你就能看到你的PR值会有什么变化了。
  如果你的网站为Yahoo和Looksmart所收录,那么你的PR值会得到显著提升。关于“Yahoo提交技巧”,如果有时间可以阅读下面这篇文章“Yahoo网站提交技巧”。
  如果你的网站是非商业性质的或几乎完全是非商业性质的内容,那么你可以通过www.Zeal.com使你的网站为 ... 业搜索列表。
  让我们继续-我是在一个星期二向Zeal提交的AKA Marketing.com,到了星期四早上它就出现在Zeal上了。到了星期一我检查了一下我的日志文件,发现来自Looksmart的大量提名,原来它已经被Looksmart收录了。后来我又查看了一下我的日志,发现MSN已经根据Looksmart的数据库而更新了它自己的数据库,而且由此而提升的好的排名也给我带来了不少的访问者。想想看吧,6天之内我的网站就出现在Zeal,Looksmart和MSN上了。所以如果你有非商业网站,可千万别忘了去Zeal.com提交你的网站哦!
  在向Zeal.com提交你的网站前,你得先通过它的一个会员小测试。别担心,这个测试是很简单的。如果你是一个网站管理员,而你的网站又已经收录在三大知名网络目录DMOZ,Yahoo和Looksmart中,我猜想你的网站的PR值一定比较高,而且搜索排名也不会差。
综述:
  1. 在网站的标题标签(TITLE tag)中包含主要关键词和关键短语。
  2. 提高网站外部链接的质量和数量。
  3. 使网站为三大知名网络目录DMOZ,Yahoo和Looksmart收录。

--------------------------------------------------------------------------------

摘自论坛:
  PageRank的提高可有效提升你在Google中的页面排名,但并不是说PageRank越高则排名越靠前。有一些网站尽管PageRank不算高,但却较一些PageRank高的网站排名还要靠前。所以你应该在对网站优化的同时,也要努力提高网站的PR值。依我看来,提高PR最佳和最简单的办法在于:
  1. 提供有趣/有价值的网站内容,这样人们会主动和你进行互惠链接,从而提高你的外部链接值。
  2. 将网站提交到各大门户网站,这样可显著改善你的网站在Google上的排名。
  3. 可将网站添加到行业门户站点、网上论坛、留言簿等等各种允许添加网址链接的地方。
  4. 与其他网站交换链接来提高链接权值。
回复 支持 反对

使用道具 举报

发表于 2004-8-30 14:44:46 | 显示全部楼层
我也贴一篇  不过看不明白
--------------------------------------------------------

什么是PageRank
Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考Google の秘密 - PageRank ?氐捉庹h一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的,由此引出第一个要点:

链接就是一切
在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。

Blogger(Weblog简称Blog)们也许最深刻的理解了这句话的含义,Blogger之间有大量相互链接,因此最经常被引用的页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。

在推广自己网站之前也许首先需要自己网站在一些搜索引擎中的知名度,有一个小工具:link popularity check。原理可以参考:如何评价网站的人气一文。

例子1:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的。
网站推广比较经典的方式就是加入比较大型网站的分类目录,比如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要从大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自大网站任何地方的反相链接都是非常有价值的,只要是出现在新闻报道,论坛,邮件列表归档,关键是要多,而且是权重高的高层页面,我的网站没有加入任何分类目录,而是将一些文章投稿在了ZDNet中国上,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。

例子2:被PageRank高的网站引用能更快地提高PageRank。
被什么样的网站引用有时候比引用次数多更重要,我的文章被ZDNet中国引用以后,相应网页的权重升高非常快。这里我要特别感谢的是,ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。

例子3:投搜索引擎所“好”
Lucene简介这篇文章被Jakarta.apache.org的lucene项目引用以后,这篇文章就成为了所有页面中PageRank最高的页面(在Google工具栏上显示是6/10),而Google深厚的学院气氛让我一直怀疑他们对.org .edu等非功利站点有特别加分

   网站推广只是手段,如何突出内容,让需要相关信息的用户能够尽快的找到你的网站才是目的,第二个要点:

标题和关键词的重要性
不要空着标题:空着<title></title>;
传统的页面中,会有类似以下的信息:用于说明网页的主题
<header>
<meta name="keyword" content="mp3 download music...">
</header>
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新的搜索引擎已经不再关心页面头文件中的meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。
标题长度:不要过长,一般在40个字符以内;如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。
标题内容:尽量用一些别人可以通过关键词找到的字眼;"Website search engine optimization" 会比"面向搜索引擎的网站设计优化"有效的多。
如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
我的猜测:搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
http://www.chedong.com/phpMan.ph ... x命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:  [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
除了<title></title>外,还可以用<h1></h1>标题行突出内容主题,加强标题的效果;
在我的网站设计中:我会把用<h1>[标题]</h1>这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
其他网站设计提示
表现和内容的分离:
网页中的javascript和css尽可能和网页分离,一方面提高代码重用度(也方便页面缓存),另外一方面,由于有效内容占网页长度的百分比高,也能提高相关关键词在页面中的比重,应该鼓励使用更规范的XHTML和XML作为显示格式便于内容更长时间的保存。
站点地图:让所有的页面都有能够快速入口,方便网页爬虫(spider)快速遍历网站所有需要发布的内容。提高网站自身的健康状态:经常利用坏链检查工具(比如:XENU)生成网站地图统计,并检查网站中是否有死链。
尽可能保持网页的持久性,保证引用你的网页能够被比较持久的稳定引用,如果网页中有链接更新时,最好能保留旧的页面并做好链接转向,保持内容的连续性。


知己知彼——站点访问统计/日志分析挖掘的重要性

    网站设计不仅仅只是被动的迎合搜索引擎的索引,更重要是充分利用搜索引擎带来的流量进行更深层次的用户行为分析。目前,搜索引擎关键词统计几乎是各种日志分析工具的标准功能,日志统计这个功能如此重要,以至于新的RedHat 8中已经将日志分析工具webalizer作为标准的服务器配置应用之一。相信商业日志统计工具在这方面应该会有更强化的实现。

以Apache/webalizer为例,具体的做法如下:

记录访问来源:
在Apache配置文件中设置日志格式为combined格式,这样的日志中会包含扩展信息:其中有一个字段就是相应访问的转向来源:HTTP_REFERER,如果用户是从某个搜索引擎的搜索结果中找到了你的网页并点击过来,日志中记录的HTTP_REFERERL就是用户在搜索引擎结果页面的URL,这个URL中包含了用户查询的关键词。
在webalizer中缺省配置针对搜索引擎的统计:如何提取HTTP_REFERER中的关键词
webalizer中缺省有针对yahoo, google等国际流行搜索引擎的查询格式:
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google.com q=
    通过这样设置webalizer统计时就会将HTTP_REFERER中来自搜索引擎的URL中的keyword提取出来,比如:所有来自google.com链接中,参数q的值都将被作为关键词统计下来,从汇总统计结果中,就可以发现用户是根据什么关键词找到你的次数,以及找到你的用户最感兴趣的是那些关键词等,进步的,在webalizer中有设置还可以将统计结果倒出成CSV格式的日志,便于以后导入数据库进行历史统计,做更深层次的数据挖掘等。

    以前通过日志的用户分析主要是简单的基于日志中的访问时间/IP地址来源等,很明显,基于搜索引擎关键词的统计能得到的分析结果更丰富、更直观。因此,搜索引擎服务的潜在商业价值几乎是不言而喻的,也许这也是Yahoo! Altavista等传统搜索引擎网站在门户模式后重新开始重视搜索引擎市场的原因,相信以后会有更多的利用互联网媒体做深层次数据挖掘的服务模式出现。

 
回复 支持 反对

使用道具 举报

发表于 2004-8-30 14:54:12 | 显示全部楼层
再贴


如果你想让各大搜索引擎可以自动找到您的网站 / 讨论区 / 讨论区?鹊奈恼
(也让他人在搜索引擎上找到您的网站 / 讨论区 / 讨论区?鹊奈恼拢
你可以使用以下的修正方法


打開 includes/functions.php

寻找

程代码:?>


之前加上

代码:function is_search_engine()
{
   global $HTTP_SERVER_VARS;

   $_this_agent = $HTTP_SERVER_VARS['HTTP_USER_AGENT'];

   $search_engines = array(
      // W3C HTML Validator:
      "W3C_Validator/1.305.2.12 libwww-perl/5.64",
      // W3C CSS Validator:
      "Jigsaw/2.2.3 W3C_CSS_Validator_JFouffa/2.0",
      // GoogleBot:
      "Googlebot/2.1 (+http://www.googlebot.com/bot.html)",
      // GID GZIP Test:
      "GIDZipTest/1.2 (+ http://www.desilva.biz/gzip-test.php)"
   );

   foreach($search_engines as $search_engine)
   {
      if (!strcmp($_this_agent, $search_engine))
      {
         // Must be an engine... is in our list.
         return true;
      }
   }

   return false;
}


打开 includes/sessions.php

寻找

代码:function append_sid($url, $non_html_amp = false)
{
   global $SID;


之后加上

代码:   if (is_search_engine())
   {
      return $url;
   }


最新的 Robot 名单(使用在 includes/functions.php 里面)

代码:   $search_engines = array(
      // W3C HTML Validator:
      "W3C_Validator/1.305.2.12 libwww-perl/5.64",
      // W3C CSS Validator:
      "Jigsaw/2.2.3 W3C_CSS_Validator_JFouffa/2.0",
      // W3C Link Checker:
      "W3C-checklink/3.6.2.3 libwww-perl/5.64",
      // Submit Express META TAG Analyzer:
      "MetaTagRobot/1.6 (http://www.widexl.com/remote/search-engines/metatag-analyzer.html)",
      // GoogleBot:
      "Googlebot/2.1 (+http://www.googlebot.com/bot.html)",
      "Googlebot-Image/1.0 (+http://www.googlebot.com/bot.html)",
      // GID GZIP Test:
      "GIDZipTest/1.2 (+ http://www.desilva.biz/gzip-test.php)",
      // Alexa/Internet Archiver:
      "ia_archiver",
      "ia_archiver/1.6",
      // Inktomi robot:
      "Slurp/2.0 (slurp@inktomi.com; http://www.inktomi.com/slurp.html)",
      "Slurp/2.0-KiteWeekly (slurp@inktomi.com; http://www.inktomi.com/slurp.html)",
      "Slurp/si (slurp@inktomi.com; http://www.inktomi.com/slurp.html)",
      // @nonymouse - WWW
      "http://@nonymouse.com/ (Unix)",
     "Fast Crawler Gold Edition",
     "FAST Enterprise Crawler 6 (Experimental)",
     "FAST FirstPage retriever (compatible; MSIE 5.5; Mozilla/4.0)",
     "Fast PartnerSite Crawler",
     "FastCrawler 3.0.1 (crawler@1klik.dk)",
     "FAST-WebCrawler/2.2.6 (crawler@fast.no; http://www.fast.no/faq/faqfastwebsearch/faqfastwebcrawler.html)",
     "FAST-WebCrawler/2.2.7 (crawler@fast.no; http://www.fast.no/faq/faqfastwebsearch/faqfastwebcrawler.html)",
     "FAST-WebCrawler/2.2.8 (crawler@fast.no; http://www.fast.no/faq/faqfastwebsearch/faqfastwebcrawler.html)",
     "FAST-WebCrawler/2.2.10 (Multimedia Search) (crawler@fast.no; http://www.fast.no/faq/faqfastwebsearch/faqfastwebcrawler.html)",
     "FAST-WebCrawler/3.2 test",
     "FAST-WebCrawler/3.3 (crawler@fast.no; http://fast.no/support.php?c=faqs/crawler)",
     "FAST-WebCrawler/3.4/Nirvana (crawler@fast.no; http://fast.no/support.php?c=faqs/crawler)",
     "FAST-WebCrawler/3.4/PartnerSite (crawler@fast.no; http://fast.no/support.php?c=faqs/crawler)",
     "FAST-WebCrawler/3.5 (atw-crawler at fast dot no; http://fast.no/support.php?c=faqs/crawler)",
     "FAST-WebCrawler/3.6 (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)",
     "FAST-WebCrawler/3.7 (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)",
     "FAST-WebCrawler/3.8 (atw-crawler at fast dot no; http://fast.no/support/crawler.asp) ",
     "FAST-WebCrawler/3.8/Fresh (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)",
     "FAST-WebCrawler/3.6/FirstPage (crawler@fast.no; http://fast.no/support.php?c=faqs/crawler)",
     "FAST-WebCrawler/3.7/FirstPage (atw-crawler at fast dot no;http://fast.no/support/crawler.asp)",
     "FAST-WebCrawler/3.x Multimedia",
     "FAST-WebCrawler/3.x Multimedia (mm dash crawler at fast dot no)",
     "Overture-WebCrawler/3.8/Fresh (atw-crawler at fast dot no; http://fast.no/support/crawler.asp)",
     "Scooter2_Mercator_x-x.0",
     "Scrubby/2.x (http://www.scrubtheweb.com/)",
     "Scooter/3.3_SF",
     "Mozilla/5.0 (Slurp/cat; slurp@inktomi.com; http://www.inktomi.com/slurp.html)",
     "Scooter/3.2.SF0",
     "Mercator",
     "Spider"
      
   );


使用 Frame 的站长们,需要注意,搜索引擎的自动排版机器人(Indexing Robots)?K不喜欢使用 Frame 的网站。因此,要增加网站被找到的几率,?务必使用 META TAG 和 NOFRAME 在你的 Frame 首页中。

以下是个简单的例子:

代码:<html>

<head>
<title>网站</title>
<meta http-equiv="Content-Type" content="text/html; charset=big5">
<meta name="description" CONTENT="简单的网站描述"> (255 字元?燃纯桑
<meta name="keywords" CONTENT="关键字或詞汇"> (255 字元?燃纯桑
<meta name="copyright" content="Copyright 年份 网站版权所有人"> (不一定要加入)
<meta name="author" content="网站作者"> (不一定要加入)
<meta name="email" content="作者信箱"> (不一定要加入)
<meta name="Robots" content="INDEX,FOLLOW"> (不一定要加入,INDEX / NOINDEX 和 FOLLOW / NOFOLLOW)
<meta name="Revisit-after" content="机器人在几天後再次进入"> (不一定要加入)
</head>

<frameset framespacing="0" border="0" frameborder="0">

<noframes>
<body>
<H1>給看不到 Frame 的人或机器人看的?祟}</H1>



给看不到 Frame 的人或机器人看的?热菀


给看不到 Frame 的人或机器人看的?热荻
... 以此类推,不需給太多的?热荩避免使用 TABLE 和 IMG



给看不到 Frame 的机器人看的連結,如果使用 FOLLOW,机器人可以使用以下链接继续浏览和排版
<br><a href="网站?鹊木W?一">名稱一</a>
<br><a href="网站?鹊木W?二">名稱二</a>
... 以此类推,不需給太多的链接



You are viewing this page because your browser is incapable of displaying frames.
Please update your browser to see our site as it should be viewed.
</body>
</noframes>

<frame name="mainframe" src="真正需要浏览的网页"></frameset>

</html>


INDEX - 把网站和找到的网?加入搜索?ひ擎
NOINDEX - 不要把网站和找到的网?加入搜索引擎
FOLLOW - 继续進入 noframes 中提到的链接
NOFOLLOW - 不要继续進入 noframes 中提到的链接

站長??可以用 http://www.submitexpress.com/analyzer/
建入网站位置和随变一种 Robot,便可以检查首?是否 Robot-Friendly


                                              作者:~Mac
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-30 15:13:46 | 显示全部楼层
非常谢谢wwhh,你的第二个帖子,对优化的讨论已经非常深入了.而且列出的代码完全与当前论坛相符.

不过,笨笨看到相关评论,对代码里的具体做法,有些担心.因为在首页里用frame装入很多不可见的页面,是被google明确定义的欺诈行为.也许对提高排名有好处,但一但被google发现并惩罚,将无可挽回.另外装入过多的页面也会导致网站过慢.

非常谢谢!
回复 支持 反对

使用道具 举报

发表于 2004-9-2 13:08:08 | 显示全部楼层
小熊做这个网站真的用了专业精神!!!
现在注册用户即将达到了500个,并且新帖子也比较多了!!!好趋势!!!努力!!!     
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|驿路枫情加拿大华人网

GMT+8, 2025-2-28 14:35 , Processed in 0.199216 second(s), 6 queries , Gzip On, File On.

快速回复 返回顶部 返回列表