EnglishChinese

有效的站点与内网搜索:7 个必要元素

各种站点与内网搜索方法并非完全相同。对于不同的搜索引擎,您应对一些必要的元素进行考虑,从而让您的最终用户和您自己都能有更好的体验。

无需配置即可获得高相关性,并可根据数据内容和用户需要进行调整
无论所搜索文档的数量有多少或者主题是什么,搜索引擎都应该在无需配置的情况下给出高相关性的结果。但是对于内容较复杂或技术性较高的网站或内网来说,可通过进行调整以细化结果列表,进而获益。与此类似,不同的用户可能希望使用不同的功能。您需要确保搜索引擎的管理接口能够将这一切变得尽量简单。

访问所有的企业内容存储库和文件格式
网络搜索引擎面临的问题要容易得多。它们要搜索的内容通常是位于网络服务器上的 HTML 网页或者 PDF 文件。而内网搜索必须访问网络服务器上的网页,文件系统中的文档,数据库中的记录或内容管理系统等等。这就需要为这些存储库和应用程序建立复杂的访问途径,以便在遵守其安全模式的同时访问其中的内容。此外,内网搜索还要求具有从您每天使用的文件格式中筛选内容和其他信息的能力,这些格式包括:Microsoft Word、PowerPoint 和 Excel;Adobe PDF;诸如 GIF 和 JPEG 的图像格式——总体而言,在许多公司服务器中存在着将近 300 种文件格式。

实施迅速
在网站或者内网上实施搜索引擎的过程应该迅速并且容易。理想的情况是,下载以及实施运行的时间总计不超过一小时,以便进行尝试使用。无需定购,无需等待软件送至手中,无需解译用户指南。这样,如果您喜欢实施后的情况,就只需转向对下一个必要元素进行考虑。

简单易行的维护
在站点和/或内网搜索的后台进行着很多复杂的任务,比如按相关性排序、访问企业应用中的内容并对其进行索引、执行安全协议,但是在前台进行的事项应该是非常简单的。当今大多数的企业组织并不具有花时间来调节搜索设置的资源。比较不同的搜索引擎时,请考虑以下问题:

  • 我在实施、进行必要的设置后,是否可以不再对引擎进行管理?
  • 对于持续进行的维护,我需要花费多少时间?
  • 我花费在维护上的时间一共有多少?

伴随企业成长的能力
当前需要搜索的文档数量可能在 1 年甚至半年以后就不再适用了。对于一般的企业,其文档数目每 6 个月至 18 个月就会增长1倍。公共网站的增长速度会比较慢,但也值得注意。要解决这个增长问题,您必须考虑以下两件事情:

  • 软件能否在不影响性能的前提下处理增长问题?
  • 许可模式是否便于添加所需的额外容量?对于搜索用设备,您是否必须将服务器返回并等待一个具有额外容量的新服务器送达?如果是这样,那么您是否能接受因停止服务而造成的损失?

分析能力:对于用户使用搜索的方式进行报告的能力
理解人们是如何使用您的搜索的,他们查找的内容是什么,然后主动进行改进,这比出现用户抱怨查找不到内容的情况要好得多。确保您的搜索引擎能提供分析和报告能力,这样你才能保证向您的用户提供的是最佳的查询体验。

真实的企业级设计,而不是针对企业环境调节的网络搜索
当今大多数网络搜索引擎依赖于 Internet 上丰富的链接结构以帮助判定网页是否与某个特定查询相关。大体而言,从其他的网页或站点通向某个网页的链接越多,在这些网站的创建者看来该网页的相关性就越高。而企业里不存在这样丰富的链接。在内网中的字处理文档、PDF 文件和电子表格之间存在多少链接?在网站中的页面之间又有多少链接?在大多数企业环境内,这样的链接根本不存在或者很少。您需要一种经过设计、测试以及实际应用,证明能够在不依赖于这种链接的情况下判定相关性的搜索引擎。

 

Ultraseek

有效站点和内网搜索要素

Ultraseek 特性

Ultraseek 说明

企业搜索与消费者搜索比较

如何为您的企业选择最合适的搜索引擎

Ultraseek 选项

基于规则的分类法

Java API

语言模块

资源共享

现在就下载ULTRASEEK!