显示标签为“Search engine”的博文。显示所有博文
显示标签为“Search engine”的博文。显示所有博文

2010年2月6日星期六

搜狗问答采集百度

发现这个问题有几个月了,开始还以为是偶然相同,就没没在意。没想到搜狗问答和百度知道相同的问题越来越多了。
难道是搜狗问答是采集百度的?网上已经有相关文章了。这里 还有 这里

总之在百度知道上能找到的搜狗问答一定也有,而且除了ID什么都没变。

http://zhidao.baidu.com/question/82608862.html
http://zhidao.sogou.com/question/20997088.html
http://zhidao.baidu.com/question/74448198.html
http://sports.wenda.sogou.com/question/48025271.html

http://zhidao.baidu.com/question/105084714.html
http://zhidao.sogou.com/question/36027212.html

不说什么了,搜狗这么大的公司竟然也做采集。
不过话说回来百度百科也没少抄Wikipedia的,想不到这回也被搜狗抄了。

2010年2月4日星期四

在百度搜索:cache.baidu.com 你会发现第一条。。。

现在再去百度已经修复了,难道百度又是被黑了?
另外site:cache.baidu.com仍然还是没有恢复。


超级骚货竟与爸爸做 爱快插进来吧水已经泛滥了
cache.baidu.com/ 2010-2-3 - 百度快照

《南方都市报》:山寨“百度投诉电话”仍居百度前列

昨日,本报报道了山寨"百度投诉电话"被百度搜索置顶的离奇事件,昨日,记者追访此事时发现,电话区号为"0898"的山寨"百度 投诉中心"已经不再置顶,但昨日晚间搜索时,该网站仍然位列搜索结果的第三位。只是随后的一条搜索结果提醒用户,"百度不提供投诉电话,请勿上当"。被骗 的张小姐得知此消息后 亦哭笑不得。她表示对此事报警的目的不在于索赔,但网络的管理实在有待加强。



"主要是想通过这件事提醒别人,网络的骗术已经到了这么明目张胆的地步。"张小姐说,她相信报警之后这种网络事件也很难解决,但是希望搜索引擎公司本身可 以提升质量,用户也要多加防备。而此事除了百度公司本身的责任之外,她认为官方的网络监管部门也应该有所作为。

"那个东方航空的网站我相信是没有备案的。"张小姐说,国家公安部和其它部门在这方面监管的力度应该是非常之大,但为什么这类骗子网站仍然能够得以存在? 无论百度能否搜索到,网站本身的存在就匪夷所思。

而百度方面,昨日记者再次试图联系其公关部,仍然无法联系到。公司业务部门亦未就此事做更多说明。

2010年2月3日星期三

百度搜到假票务被骗财 搜百度投诉电话再遇假

"百度一下,你就知道。"但在南山科技园工作的张小姐的搜索体验却成了"百度一下,你就被骗"。前日,她先是在百度搜索到的东方航空公司网站订机票 被骗汇款1758元,随后气愤之下在百度搜索"百度投诉中心电话"时,被百度置于第二位的一个百度投诉中心的电话竟然也是"假冒伪劣",让她再去银行柜员 机操作告知账号和密码。张小姐当天即报警,但昨日,这家投诉中心的电话竟然由第二位升级到了置顶待遇。

  购买机票被骗汇款1758元

  张小姐向记者说起时仍哭笑不得。张小姐因过年不能回家,让家人来深过年,得知东方航空有航班从老家宜昌飞往深圳,张小姐在百度搜索引擎里输入了 关键字"东方航空订票电话",置顶的网站(shhktjjp.com) 是百度的"推广链接",看起来也很像东方航空的官网,订票电话"400-735-2892",张小姐对其权威性深信不疑。

  拨打该订票电话,张小姐订了两张由宜昌到深圳的机票,对方让她汇款1758元到一个工行账户中。汇款之后之后对方又致电张小姐,告知她机票需要 激活,让她再到工商银行柜员机去进行进一步操作。张小姐才怀疑自己上当受骗。

  张小姐马上致电东方航空查询订票信息,才发现票根本没有订到,她只能再订了两张机票。

  "百度投诉中心电话是假冒"

  气愤难平的张小姐决定向百度公司投诉,她在百度搜索引擎中输入"百度投诉中心电话"。置顶网站只介绍百度投诉中心,没有留电话,但排名第二的网 站则有明确的投诉电话:"089-88808-8385",并且注明:人工服务。

  张小姐打过去后,对方非常友善地接受了张小姐的投诉,表示道歉并愿意赔偿损失。但赔偿损失的方式是让张小姐再去工商银行的柜员机,在他们指示下 进行操作,并提示张小姐需要告知账户密码等资料。

  "马上觉得手法熟悉,跟那个订票网站如出一辙。"她说,连假冒百度投诉中心的电话在百度搜索排名里都能排上第二位,堂而皇之,让她无语。

  之后张小姐的反应是立即报警。警方给她做了笔录,表示会进一步调查核实,然后再决定处理方式。

  真百度投诉后:订票网站消失"百度投诉中心"置顶

  报警之后,张小姐通过百度网站找到了百度客服人员,对方记录了她反映的问题之后表示将尽快处理,但具体如何处理,亦未相告。

  记者拨打了"400-735-2892"的订票电话,对方表示对张小姐的信息还要再查询之后方能确定是否订到票。而百度投诉中心的"089"电 话拨通之后,对方表示身在北京,接受处理百度的一切投诉,当记者表明身份之后,对方马上表示:"对不起您打错了,我们不是百度的投诉电话。"随即挂断。

  昨日记者再度查询张小姐遇骗的订票网站时,该网站已经在百度搜索结果中消失。而 "百度投诉中心"的网站居然由"第二"升级到了置顶位置。

  记者致电百度公关部,始终无人接听,而百度客服在接到记者反映之后表示也查到了"快照"的结果,表示会与推广和售后服务部门联系,在核查明确之 后再决定如何处理。至于是否为张小姐的损失提供赔偿,他表示尚无法决定。

《南方都市报》


2009年7月1日星期三

Google Hosts文件

研究了一晚上google的域名,自己从位于加利福尼亚的谷歌总部DNS服务器上扒出来的。
把下面的内容添加到C:\Windows\System32\drivers\etc\hosts文件中就行了

#Search
64.233.189.147 www.google.com
64.233.189.104 www.google.com
64.233.189.99 www.google.com
64.233.189.147 www.l.google.com

#Mail(POP3/SMTP)
209.85.147.109 pop.gmail.com
209.85.147.109 smtp.gmail.com

#WebMail
64.233.189.18 mail.google.com
64.233.189.19 mail.google.com
64.233.189.83 mail.google.com
64.233.189.18 www.gmail.com
64.233.189.19 www.gmail.com
64.233.189.83 www.gmail.com
64.233.189.19 googlemail.l.google.com

#Docs
64.233.189.101 writely-china.l.google.com
64.233.189.101 writely.l.google.com
64.233.189.102 docs.google.com
64.233.189.101 docs.google.com
64.233.189.100 docs.google.com

#Map
64.233.189.104 map.google.com
64.233.189.99 map.google.com
64.233.189.147 map.google.com
64.233.189.104 maps.google.com
64.233.189.99 maps.google.com
64.233.189.147 maps.google.com
64.233.189.99 maps.gstatic.com
203.208.39.93 khm.google.com
203.208.39.91 mt0.google.com
203.208.39.93 mt1.google.com
203.208.39.91 mt2.google.com
203.208.39.91 mt.l.google.com
64.233.189.99 maps.l.google.com

#Scholar
64.233.189.99 scholar.google.com
64.233.189.104 scholar.google.com
64.233.189.147 scholar.google.com
64.233.189.104 scholar.l.google.com

#Group
64.233.189.102 groups.google.com
64.233.189.100 groups.google.com
64.233.189.101 groups.google.com
64.233.189.101 groups.l.google.com

#Misc
64.233.189.101 id.google.com
64.233.189.102 id.google.com
64.233.189.100 id.google.com
64.233.189.100 id.l.google.com

2008年11月28日星期五

百度李彦宏公布五项整改措施

针对前段时间被炒得沸沸扬扬的竞价排名事件,百度公司董事长兼首席执行官李彦宏日前约见新华社记者,郑重发布了公司的5项整改举措.
李彦宏说,首先,第一时间下线相关关键词.在央视《新闻30分》报道百度竞价排名业务存在问题后,百度公司立即召开会议,制定整改措施,6个小时后报道中涉及的4个医疗关键词的所有竞价排名推广下线.

第二,全面审核相关行业客户资质,已实施6批次对医疗机构、药品类等竞价排名客户资质进行全面审核,对没有资质或资质不健全的客户坚决进行下线处理;并要求相关行业客户重新提交资质说明,进行全面、严格的审核.

第三,百度公司全面审核相关行业关键字,累计7批次对医疗行业关键词进行全面排查审核,下线不合格、不规范的客户关键字.

第四,严肃处理相关责任人.公司对协助提供作假文件以通过百度内部审核的员工已经做出辞退处理,并在全公司加强内部管理,完善销售环节监控.

李彦宏最后介绍说,为彻底解决问题,百度公司将尽快启动新的广告系统.在全公司分析师电话会议上,管理层已宣布将尽快完成开发新的广告系统“凤巢”(Pheonix Nest),更好地解决普通搜索和竞价排名搜索结果的关系,从而为用户提供更清晰、完善的服务信息.

据记者了解,目前百度公司拥有7000名员工,在中国搜索引擎市场上的份额为70%,在各国本土搜索引擎中罕有地超过谷歌.但竞价排名事件之后,百度公司股价已跌到两年来的最低点.

2008年9月14日星期日

百度收录淘宝再次有力地证明了百度无视robots.txt

不久前淘宝已经屏蔽百度蜘蛛,不过一直以来对百度是否真正遵守robots.txt存在怀疑.

目前又去百度搜了一下 淘宝,发现淘宝网站仍然在列,另site一下www.taobao.com,百度一下,找到相关网页约2,310篇,用时0.001秒。这里收录数量明显比以前少,但还没有完全删除。
相信淘宝也是知道百度无视robots.txt的,可能同时用了其他手段来限制百度收录。

2008年8月20日星期三

Googlebot是Nokia6820

偶然查看网站日志,发现以下类似记录:
66.249.71.146 - - [18/Aug/2008:03:44:43 +0000] "GET /main/wap/index.php?p=76 HTTP/1.1" 200 11226 "-" "Nokia6820/2.0 (4.83) Profile/MIDP-1.0 Configuration/CLDC-1.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)"
66.249.71.144 - - [18/Aug/2008:03:45:11 +0000] "GET /main/wap/?paged=2 HTTP/1.1" 302 9078 "-" "Nokia6820/2.0 (4.83) Profile/MIDP-1.0 Configuration/CLDC-1.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)"

Google的移动抓住工具很有意思,还是Nokia6820。可能Googlebot的确是在模仿各种手机的浏览,让他的抓住工具看起来更像真实的手机,而不是机器人爬行。

2008年8月19日星期二

DoCoMo/1.0/N505i/c20/TB/W20H10

今天在日志中发现了一个奇怪的bot在爬行我的网站,User Agent是
DoCoMo/1.0/N505i/c20/TB/W20H10 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)
Googlebot-Mobile是Google的移动抓取机器人,只是不解前面还是DoCoMo。
难道Googlebot就是把自己虚拟成真正的手机在浏览?
相关资料:

日本手机龙头老大-DOCOMO
NTT Docomo
是日本电报电话公司的手机公司(或服务品牌),相当于国内的中国移动的神州行或全球通的叫法。
NTT是Nippon Telegraph and Telephone Public Corporation的缩写。
Docomo是日文どこも的发音(罗马字),是哪儿都行的意思。

NTT DoCoMo是目前世界上最大的移动通信公司之一,也是最早推出3G商用服务的运营商。

2008年8月12日星期二

《Google网站管理员指南》名言

Google网站管理员指南》名言:请不要为了提高搜索引擎排名而弄虚作假。 一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样做?"

2008年8月5日星期二

谷歌音乐搜索灵光闪现

今天中午,进入谷歌音乐搜索的域名(www.g.cn/music),非常惊奇地发现,这个页面已经可以访问。不过,过了几分钟后,又还魂到之前的 404界面。以下是界面截图。谷歌音乐搜索的首页,是“新歌一百强”的列表页面,左上角是谷歌常有的导航,右上角是“打开播放器”的链接,Logo使用的 是普通Logo,并未制作频道 Logo。





在谷歌音乐搜索中,谷歌提供了试听、下载、歌词和彩铃服务,其中,试听的链接地址是www.google.cn/music/top100/, 下载和歌词都是g.top100.cn,而彩铃则将用户引导至中国移动12530的页面。

在谷歌音乐搜索中,可以根据歌手、歌名和专辑名进行搜索。在顶部的搜索框下方,有三个下拉菜单进行导航,分别是歌曲排行榜:歌曲200强、新歌 100强、摇滚歌曲、影视金曲、民族歌曲;歌手排行榜:歌手100强、乐队组合、男歌手、女歌手、大陆歌手、港台歌;专辑排行榜:专辑100强、新碟 100强、摇滚专辑、影视原声大碟、中国民乐专辑、新歌100强。

搜索的效果如何?当我搜索“周杰伦”时,只有周杰伦与温岚合唱的一首《屋顶》,周杰伦与李玟合唱的《刀马旦》,以及歌手信息,其他,都是与周杰伦不怎么有关联的。这说明,谷歌尚未与周杰伦歌曲的版权公司谈判完成。在谷歌音乐搜索的帮助文档(现在也无法打开了)中,谷歌对此说明:若无法搜索到音乐,说明谷歌的合作伙伴巨鲸音乐网尚未与这家唱片公司谈判成功,“请与巨鲸公司联系”,-_-|||,让用户与巨鲸公司联系干吗?!

我猜想,谷歌公司一定很郁闷,偶尔的一次公开测试,就被人不小心看到了,而且是被我看到的,哈哈~不过估计也会是另一种心情,有人帮忙炒作了。只是苦了我,要被网友骂为“和kissbaidu”一样的献媚博客了……

×除注明外均为原创,若需转载或引用,请注明来自与G共舞本文链接及本声明.

2008年8月1日星期五

给网站管理员的建议:创建可利用的、可抓取的网站

2008年2月28日星期四

Google PR 正在更新

版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
刚刚在点石看到Google PR 正在更新一文。
看到这篇文章,检查了一下自己的PR,似乎没有变化。也许是我的网站更新还没有开始还是PR不更新了。
最近的Google PR有点怪异。PR上个月才更新过,这次更新才隔了一个多月,似乎并没有按照往常的3个月一次。不知道Google是不是不按照那种有规律的更新了?

2008年1月31日星期四

隐藏 robots.txt

robots.txt 会暴露目录结构的问题,今天找到了答案。用 urlrewrite

RewriteCond %{HTTP_USER_AGENT} ^(Mozilla|Opera)
RewriteCond
%{HTTP_USER_AGENT}!(Slurp|surfsafely)
RewriteRule ^robots\.txt$ /someotherfile [L]

或者干脆 urlrewrite 到 cgi 或者 php 文件。
如果不想 urlrewrite 的话还可以设置txt伺服类行为应用程序,application/x-httpd-php .txt,对 .txt 当成 php 处理。注意:这时候站点内的其它 .txt的第一句都要有

详细说明在 Advantages of a smart robots.txt file

2008年1月26日星期六

申请从谷歌的索引中删除内容

转载自谷歌中文网站管理员博客
(译者注: 本文讲述了如何申请从谷歌的索引中删除内容,包括你自己拥有的内容及其他你所不拥有但是包含特殊信息的内容,如不健康内容或你的个人信息)

作为网站拥有者,网站的什么内容被搜索引擎索引,你完全可以控制。当你想让搜索引擎知道什么样的内容您不希望它们索引时,最简单的方法是使用robots.txt文件或robots元标记。但有时候,你想要删除已经被索引的内容。有什么最好的方法来做到这一点呢?

同以往一样,我们的回答总是这样开始:这取决于你想要删除的内容的类型。我们的网络管理员帮助中心提供了每种情况的详细资料。每当我们重新爬行该网页, 我们就会从我们的索引中自动移去你要删除的内容。但如果你想更快地删除你的内容,而不是等待下一次的爬行,我们刚刚有了一些方法使做到这一点变得更为容易。

如果你的网站已经通过了网站管理员工具帐号的网站拥有者验证,你就会看到在"工具"下有一个删除网址链接。要想删除,你可以点击删除网址链接,然后再点击新增删除请求。请选择你想要的删除类型。

单个网址
如果你想移除一个URL或图像,请选择此项。一个可以删除的URL必须符合以下条件之一: 如果一个URL可以被删除了,你输入该URL,看看它是否出现在我们的网页搜索结果或图像搜索结果里。然后点击添加。您可以一次添加多达100个URL的请求。当你添加完所有你想删除的URL后,点击“提交删除请求”。

单个目录
如果你想删除你站点的一个目录下的所有文件和子目录,请选择此选项。例如,如果你请求删除以下内容:

http://www.example.com/myfolder

这将删除所有以该路径为开头的URL,譬如:

http://www.example.com/myfolder
http://www.example.com/myfolder/page1.html
http://www.example.com/myfolder/images/image.jpg

为了使目录可以被清除,你必须用robots.txt文件来阻截搜索引擎。例如,上面的例子中, http://www.example.com/robots.txt可以包括以下内容:

User-agent: Googlebot
Disallow: /myfolder


你的整个网站
只有当你想从Google索引删除你的整个网站时,才选 择此选项。此选项将删除所有子目录及文件。对于你网站的被索引的URL中你不喜欢的版本,请不要使用此选项来删除。举例来 说,如果你想你的全部URL只有www的版本才被索引,请不要使用这一选项来请求删除非www的版本。你可以使用设置首选域名工具来指定你希望被索引的版本(如果可能的话,做一个301重定向到你喜欢的版本)。使用此选项,你必须使用robots.txt文件拦截或删除整个网站

缓存副本

要删除你的网页在我们索引中的缓存副本(又称网页快照--译者注),请选择此项。你有两种方法来使你的页面符合删除页面缓存的条件。

使用noarchive元标记来要求快速删除
如果你根本不想让你的页面被缓存,你可以在该页面上加一个noarchive元标记,然后再在工具中要求快速删除缓存副本。通过使用工具来要求删除缓存副本,我们会立刻执行。由于添加了noarchive元标记,我们将永远不会有该页的缓存版本。 (当然,如果你以后改变主意,你可以去掉noarchive元标记)。

改变网页内容
如果你的某一页面已被删除,你也不想让它的缓存版本存在于Google的索引中,你可以在工具里请求删除缓存。我们会先检查一下该页的现有内容是否真的有别于缓存版本。如果是,我们就会清除缓存版本。我们会在6个月后 自动显示最新的缓存页面版本(6个月后,我们可能已经又爬行过你的页面,缓存版本会反映最新的内容) ,或者,如果你发现我们早于6个月重新爬行了你的页面,你可以用工具要求我们早一点重新包含缓存版本。


查阅删除请求状态
你的删除请求状态将是“等待中”,直到他们被处理。处理后的状态变化,要么是“被拒了”或者是“删除了”。一般来说,如果被拒绝,它一定是不满足被删除的条件。

请求内容的重新收录

如果请求是成功的,它就会出现在删掉的内容栏里。你可以随时重新收录你的网页,只要删掉robots.txt中的相关内容或相关页上的robots元标记,然后点击Reinclude。删除内容的有效期是六个月。六个月后,如果我们重新爬行网页时网页内容仍然是被阻截的或者返回一个404或410状态信息,它就不会被重新索引。不过,如果六个月后该页面可以被我们的抓取工具抓取,我们将再次把它列入我们的索引。

请求删除不是你拥有的内容

如果您想要求删除的内容在不属于你的网站上,怎么办呢?现在做到这一点更容易了。我们的新的网页删除请求工具逐步和你完成每个类型的删除过程。


因为Google仅仅索引网页,并不能控制网页的内容,我们通常不能从我们的索引中随便删除一些结果,除非网络管理员阻截Google、修改了内容或删除了页面。如果您想删除某些内容,你可以和网站所有者进行一下沟通,然后用此工具来加速从我们的搜索结果删除。

但是,如果您发现搜索结果中包含特定类型的个人信息,你可以请求删除,即使你不能和网站所有者沟通。对于这种类型的删除,请提供您的电子邮件地址,以便我们能够与您直接沟通。




当启动健康内容搜索时,如果您发现一些搜索结果中有不健康的内容,你也可以使用工具通知我们。


你可以查阅“等候中”请求的状态。在当前网站管理员工具的版本中,一旦请求被处理,请求状态将会变成“已删除”或“拒绝”。一般来说,如果被拒 绝,它一定是不满足被删除的条件。对涉及个人信息的请求,您看不到任何状态,但是你会收到一封电子邮件来要求你为以后的步骤提供更多的资料。

老的URL删除工具中的请求会有什么样的结果呢?
如果您已经用老的URL删除工具提交了删除请求,你仍然可以登录来查阅这些请求的状态。但是,如果你有新的请求,请使用现在的新的和改进的工具版本。

2008年1月24日星期四

子域名和子目录

转载自谷歌中文网站管理员博客

(译者按: Matt Cutts, 谷歌反网络垃圾组的带头人。本文译自Matt Cutts的个人博客,供读者参考)
原文: Subdomains and subdirectories
发表于:2007年12月10日上午12时17分

Pubcon会议接近尾声时,我发现 的文章在谈论Google对子域名和子目录的处理。也许我在会上没有把这一方面说清楚,我在这里再详细谈谈这个主题。

从以往记录来看,使用子域名与子目录的时间几乎是对等的。顺便提示一下,在一个象subdomain.example.com/subdirectory/的网址中 ,子域名是"subdomain",子目录是"subdirectory" (有时也被称为文件夹)。如果您还不清楚,你也许可以阅读一下我的“一个URL的组成部分的辅导材料”

如果你把你的内容放在子目录里,通常的原则是所有信息都存储在同一空间里。这可以使找到/编辑/更改代码变得很容易。同时,它也不难把代码从一个地方移到另一个地方。然而,一个子域名往往是一个域名系统(DNS)的别名。子域名的设置对网络管理员新手来说可能有点难,特别是如果"CNAME"对你来说不意味着任何意思。子域名可以分开管理,对你来说可以是一个好事(如果你想转移你网站的一部分,你可以使用DNS来和子域名脱钩),也可以是个头疼的事(DNS的设置相当麻烦,不像使用子目录一样仅仅使用几个命令就可以建立或移动目录)。以我为例,当我开始建我的博客时,我决定用一个子目录(mattcutts.com/blog/),仅仅是想使事情变得简单。

几年来,Google使用了一个所谓的"密集主机(host crowding)"算法,它意味着,对一个域名的每个主机名(hostname)或子域名,Google至多显示两个结果。这种办法(从一个子域名内显 示1-2个结果)一直运行非常良好,但我们也收到这样的投诉:对一些类型的搜索 (如生僻或长尾搜索),Google的一个搜索页面上可能出现很多结果都来自同一个域名的情况。在过去几个星期里,我们改变了我们的算法,使这一现象在未来再也不太可能发生。

这一变化并不会彻底改变有些搜索结果全部来自同一域名的情况;如果某个域名相关性确实非常强,我们仍可能从那个域名中返回多个结果。举例来说,如果一个搜索是[ibm],用户可能确实喜欢并想看到从ibm.com的结果。注意我们的算法变化是一个相当微妙的变化,并没有影响到我们绝大部分的搜索。事实上,这种变化已经存在了几个星期左右,到现在也没有人注意到。:)我在PubCon上谈及此变化的唯一原因是因为有人想听听我对子域名与子目录的意见。

对子域名和子目录,我个人更喜欢子目录。这是因为 我通常倾向于子目录为我的大部分内容提供的方便。一个子域名可有效分离出完全不同的内容。例如,Google为完全不同的产品使用子域名,例如news.google.com或maps.google.com。如果你是一个网络管理员或搜索引擎优化业者新手, 我建议你使用子目录,直到你对你的网站结构有足够的信心。在这一点上,您将可以对你的网站有更好的理解,从而作出正确的决定。

2007年10月27日星期六

Google PR大规模更新

早上起来一看Google Toolbar 上面的绿块,很多站的PR都已经刷新,这是很多SEOer期待已久的事情。

随便看了一些站,观察了一些5月份后增加的栏目和文章,PR由原来的0升到2-3不等,不过有点意外的是有几个8月份注册的域名PR也都上升到3了,也有部分由3降低至2,当然,本次更新来的比较突然,仿佛就在一夜之间,关于还会不会有什么新的变化或者调整,我们继续关注中,赶快Check一下你的站点吧!

作者: 枫林&SEO博客

2007年10月20日星期六

Google灯

晚上的时候打开Google.com,发现Google的背景变成了黑色的了。
http://www.google.com/lightsoutsf/
谷歌用户在旧金山湾区将公告今天,我们" ,把灯" ,对google.com的网页,作为一种姿态,以提高人们的全市节约能源活动的所谓灯出旧金山。
On Saturday, October 20, 2007, Lights Out San Francisco invites the entire city of San Francisco to install one compact fluorescent light bulb (CFL) and turn off all lights for one hour, from 8:00 pm to 9:00 pm PDT.上周六, 2007年10月20日,所有的灯都列旧金山请整个旧金山市安装一个紧凑型荧光灯泡( cfl的) ,并关掉所有灯光一小时,从下午八时至下午九时之中。 According to estimates, turning the lights out in San Francisco for even one hour could save as much as 15 percent of the energy consumed on an average Saturday night.据估计,转灯,在旧金山,甚至一小时,可节省高达15 %的能源消耗对平均周六夜。
Given our company's commitment to environmental awareness and energy efficiency, we strongly support the Lights Out campaign, and have darkened our homepage today to help spread awareness of what we hope will be a highly successful citywide event.鉴于我们公司致力于环保意识和能源效率的,我们坚决支持灯光出来竞选,并已漆黑,我们今天的网页,以帮助传播的认识,我们希望将是一个极为成功的全市性活动。

2007年9月19日星期三

How we use spam reports

Google Webmaster Tools not only help us communicate with webmasters, but also provide a channel for you to inform us about spam sites you find online. Thanks to you, we’ve received many spam reports that have helped us improve search quality by showing more relevant, useful sites in our results.It's easy to submit a spam report via either of two channels, authenticated and unauthenticated. We give a higher priority to the reports that are submitted through an authenticated channel such as Webmaster Tools. Or you can submit unauthenticated reports. Since the unauthenticated reports are reported anonymously, we may give it lower priority to process.Here's how a spam report submitted from Webmaster Tools is processed:
We evaluate the spam report
We take spam reports very seriously, and we have dedicated staff to timely process reports.
We primarily evaluate spam reports in reference to our webmaster guidelines. We determine whether we agree or disagree with the user's report.
A spam site commonly uses illicit techniques to mislead search engines to (mis)lead users to certain websites. The Webmaster Guidelines cover most (but not all) common forms of behavior that we consider deceptive or manipulative. We suggest you review our webmaster guidelines listed in our Webmaster Help Center. These will help you create a search-engine friendly website that both Google and users would view as spam-free. There are cases where we disagree with the spam report's evaluation, and those reports are then disregarded. The confirmed reports are forwarded to our engineering teams.We take action on confirmed spam reports
We take action on many confirmed spam sites, either manually and/or algorithmically. Furthermore, the extent of our action is dependent on the severity of the violation -- a confirmed spam report doesn't necessarily mean the entire site will be removed from the index.Taking action on spam by improving our algorithmsIt's most efficient for us to combat spam through our algorithms. We use spam reports about one site to create algorithmic improvements detecting spam in all sites similar to the report. We then extensively test our changes before we push our new code into production. This engineering process takes time. When people ask the question "Why haven't you penalized the spam site I've reported?", if we confirmed their spam report, then it's likely that we're working, or will be working, on an algorithmic solution.Taking manual action on a spam siteWe may also take manual action on confirmed spam sites. This process is obviously much faster, but it's not as robust a method to improve our search quality as the algorithmic approach.We can contact webmasters to correct their site
If we believe that a reported spam site is in violation of the webmaster guidelines but is otherwise legitimate, we may try to contact the webmaster to correct their site. We contact webmasters via email and, if they have a verified site in Webmaster Tools, we can also send them a note through the Message Center. Our goal is to deliver the most relevant results to users. We hope that our users and webmasters keep reporting spam sites, as it helps us to improve our algorithms and improve search quality. If you have questions about what's spam, visit our Help Center or post your question in our discussion group. And, of course, if you find a spam site, please let us know!