雅虎如何抓取网站?
雅虎应用雅虎搜索引擎技术(Yahoo! Search Engine Technology,简称YST),它是一套基于算法的Web索引抓取程序,能够自动探测网络内容。YST 这套机器搜索程序从因特网上采集文档,建立起一个可搜索的索引系统。这些文件(即您的网站文件)能被YST程序发现和抓取的主要原因是,在因特网其他的网页上包含有这些文档的直接链接。
YST 搜索程序严格遵守robots.txt标准执行抓取,因此,对于那些您不希望被雅虎搜索引擎返回的结果,搜索程序不会执行抓取。任何被robots.txt标准认为不适宜抓取的文件,既不会被包括在抓取文档中,也不会进入到搜索引擎的数据库。
雅虎认为哪些是作弊网站?
如果您的网站存在以下行为,就非常有可能被雅虎列为作弊网站,而不予收录:
在网页中存在隐藏文字或隐藏链接;
在网页中存在大量与网页内容不相关的关键词;
在网页中使用不必要的跳转或者重定向技术;
在页面中存在大量链向其他网站的链接;
在整个网站中存在大量重复内容的页面;
一个域名下存在大量不必要的子域名;
在页面中存在大量恶意广告、恶意代码或有害插件的网站;
在页面中存在主动链向已经被雅虎放弃的网站;
在大量从留言本,论坛等群发链接;
如果您的网站确实存在以上现象,您可以重新整理清除这些作弊行为并重新向雅虎 提交您的网站 ,我们非常乐意重新收录您的网站。搜索引擎会在下一个索引周期(约2-4周左右)完成后重新检查是否有欺骗搜索引擎行为并决定收录。
雅虎网站关键词排列位置由什么决定
网站排列位置主要由网站自身质量和与关键词的相关性强弱排列。
当然,您同时可以采取下述方法来提高排名:
高质量的网站内容,雅虎喜欢原创的,专业的,特殊的,有意义的网页内容;
尽量使用搜索引擎能够识别的文本信息,避免过多的Javascript、Cookie、框架、DHTML 或 Flash 等复杂技术;
不要在留言本或论坛中大量添加您网站的链接;
专业认真用心的去对待访问您网站的用户;
对于使用采用不正当手段骗取排名的网站搜索引擎会自动降低排名,比如:在网页标题中堆积大量无关关键词,在网页的meta keywords中堆积大量无关关键词等,而主动链接这些作弊网站的网站,也会被搜索引擎降低排名。
雅虎收录网页方法
如果您有一个新网站,您可以选择:
a.向雅虎 提交我的网站
b.与同类型已经被雅虎收录的网站交换链接,我们的蜘蛛就会发现并收录您的网页
如果您的网站有一定历史但仍然没有被雅虎收录,需要检查:
a.robots.txt文件是否正确
b.是否适合搜索引擎抓取,现实中仍然还有很多网站无法被机器搜索到,无论是通过雅虎还是其他同样强大的搜索系统
c.是否有大量留言本链向您的网站
d.您的网站是否有被雅虎列为作弊的行为 |