查看: 666|回复: 0

[转 换] 谷歌:哪些Flash文件和里面的内容能被更好的引得

[复制链接]
发表于 2012-9-16 15:50:52 | 显示全部楼层 |阅读模式
我们收到过好些期许我们改进对 Adobe Flash 文件引得问题的提议。今日,引得团队的软件工程师 Ron Adler 和 Janis Stipins ,勉强我们近来在 Flash 文件引得编制上获得的改进与大家施行更深化的探讨和交流。
问:现下哪些 Flash 文件能更好地被谷歌引得到呢?
我们改善了对所有类型 SWF 文件中的书契内容的引得能力,其中涵盖像按键或菜谱这么的 Flash “小工具”,独立自成一体的 Flash 网站,以及所有介于两者之间的 Flash 仪式。
问:这些 Flash 文件中的哪些内容能被谷歌更好地引得呢?
用户在与您的 Flash 文件互动过程中所看见的一切文本内容都将达成更好地引得。假如您的网站包含 Flash ,其中的书契内容会被 Google 用来世成您网站的提要。同时,出如今 Flash 文件中的书契可以用来般配用户在 Google 搜索框中输入的搜索查询。
除开引得 Flash 文件中的文本内容,我们如今也能够识别在 Flash 文件中的出现的 URL ,而且把这些链接纳入搜引得擎机器人爬行的目标队列中,就像看待那些非 Flash 网页中出现的 URL 同样。例如,假如您的 Flash 应用手续中包含指向您网站内部页面的链接,Google 如今能够更好地发现并抓取您的网站。
问:那么 Flash 文件中包含的非文本内容呢,譬如图片?
现下,我们只能识别和引得 Flash 文件中的文本内容。假如您的 Flash 文件里只有图片,我们将不得识别和引得出如今这些图片中的任何书契。类似地,假如一个 Flash 按键没有任何附属的书契的话,我们将无法对这类指向特定链接的 Flash 按键生成任何錨文本。
还应注意到的是,我们无法引得 FLV 文件,譬如在 YouTube 上播放的视频,因为这些文件没有包含任何书契元素。
问:Google 是怎样识别 Flash 文件里的内容呢?
我们开散发了一种算法,这种算法可以使 Google 机器人能够临摹人类经过点击按键、输入内容等形式来理解 Flash 文件。我们的算法能够记取沿途它遇到的所有书契内容,其后这些内容都能被引得到。我们无法奉告您更多的保密细节,不过我们可以奉告您,经过使役 Adobe 的新式可检爽性 SWF 数据库,这种算法的管用性达成达进一步增长。
问:我怎样做能力使 Google 引得到我的 Flash 文件中出现的文本呢?
基本上,您不必做任何事体。我们已经获得的技术改进,使这项功能的实行,无需网页设计者或网站管理员做任何出奇的操作。假如您的网站上有 Flash 内容,我们会在现存技术能力的基础上,尽最大能力对它们半自动施行引得(详见接下来的问题)。
也就是说,您应当理解 Google 如今已经可以识别那些展如今您网站过访者面前的书契信息。假如你期望 Google 疏忽一点次要内容,如“版权”或“加载”等信息,您可以考量把那些文本替换为图片,这么它们就不会被我们抓取到达。
问:在引得 Flash 文件上,Google 遇到的主要技术难题是啥子?
现下的问题主要体如今三个方面,这也正是我们在黾勉解决的:
1、Googlebot 不得执行某些类型的 JavaScript 手续。故此,假如您的网页经过 JavaScript 加载 Flash 文件的话,Google 可能无法识别该 Flash 文件,在这种情况下,它将不会被引得到。
2、现下,我们还无法把那些经过您的 Flash 文件加载的外来内容和您的 Flash 文件整合起来。也就是说,假如您的 Flash 文件加载了一个 HTML文件,或一个 XML 文件,或另一个 SWF 文件等等,Google 将作别引得这些资源,不过它们将不会被认为是您 Flash 文件内容的一局部。
3、虽然我们能够引得在网络上出现的几乎所有语种的 Flash ,但在识别用双向语言书写的 Flash 内容还有一定艰难。在这个问题解决之前,我们将无法识别和引得 Flash 文件中的希伯来文或阿拉伯文的内容。
本文由青海10010网上营业厅http://www.swslash.com/提供 转载请注明出处
您需要登录后才可以回帖 登录 | 点击这里注册

本版积分规则

小黑屋|Archiver|phpcms网站管理系统 ( 京ICP备14011169 )

GMT+8, 2019-6-27 10:24 , Processed in 0.165354 second(s), 8 queries , Memcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表