<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head><meta forua="true" http-equiv="Cache-Control" content="max-age=0" /></head>
<card title="有效使用robots.txt" id="card1">
<p> 游客</p><p>
标题:有效使用robots.txt<br/>
正文:<br/>
有效使用robots.txt一个robots.txt文件可以告诉搜索引擎你网站的哪些部分允许它去抓取。而这个文件不旦必须命名成&amp;rdquo;robots.txt&amp;rdquo;,还得放在你网站的根目录上。我们网站robots.txt文件的路径。所有的遵循这一规则的搜索引擎爬虫（按照通配符*指示的那样）不应该进入并抓取/images/或者任何以/search开头的url里的内容。你也许并不希望你网站的一些页面被抓取到，因为如果它们出现在搜索结果里对用户可能是没多大意义的。如果你想阻止搜索引擎爬取你的网页，Google网站管理员工具有一个很好用的robots.txt生成器来帮助你创建这个文件。另外如果你希望子域名里的一些内容不被爬取，你需要在子域名的目录下再新建一个robots.txt文件。你也可以在我们的网站管理员帮助中心获得更多关于robots.txt的信息。这里也有其它更便捷的方式来阻止你的内容出现在搜索结果里，比如说在 robotsmeta标签里添加&amp;rdquo;NOINDEX&amp;rdquo;，使用htaccess来为一些目录加密或者使用Google网站管理员工具来移除某些已经被索引的内容。 Google工程师MattCutts一个帮助视频里粗略地介绍了各种URL排除原理的注意事项。    Google网站管理员中心发布的一份针对SEO的入门级指南手册。由个篱翻译成中文。在线阅读：这里。    16robots.txt实践经验   1  为那些敏感的内容使用更加安全的方案&amp;mdash;&amp;mdash;通过robots.txt来阻止一些敏感或者机密的内容。之所   以这样做的是因为如果那些你在 robots.txt里阻止的链接出现互联网上（比如说来源记录），搜索引擎   就很可能引用这些URLs（不过仅难是URL，不会含有标题或者内容片段）。还有一些不遵守机器人   排除标准的流氓搜索引擎则会违背robots.txt上的指令。最后一些好奇的用户就会去查看你robots.txt   是声明阻止的目录或者子目录，并猜测那些你不想被看到的内容。所以对内容加密或者通过 .htaccess  <br/><a href="https://www.ntsem.com/blog/wap.asp?mode=WAP&amp;act=View&amp;id=9&amp;Page=1">[&lt;&lt;]</a><a href="https://www.ntsem.com/blog/wap.asp?mode=WAP&amp;act=View&amp;id=9&amp;Page=1">[[1]]</a><a href="https://www.ntsem.com/blog/wap.asp?mode=WAP&amp;act=View&amp;id=9&amp;Page=2">[2]</a><a href="https://www.ntsem.com/blog/wap.asp?mode=WAP&amp;act=View&amp;id=9&amp;Page=3">[3]</a><a href="https://www.ntsem.com/blog/wap.asp?mode=WAP&amp;act=View&amp;id=9&amp;Page=3">[&gt;&gt;]</a><br/>
<br/>
<a href="wap.asp?act=Com&amp;id=9">查看评论(0)</a><br/>
<a href="wap.asp?act=AddCom&amp;inpId=9">发表评论</a><br/><br/>

<br/>

<br/>
<a href="https://www.ntsem.com/blog/wap.asp">首页</a>
</p>
</card>
</wml>