
网络搜索引擎,网络搜索引擎如何工作
21世纪是信息时代. 随着信息科学技术的不断发展按工作原理划分 常见的搜索引擎,互联网已成为人们生活的重要组成部分. 信息呈指数增长. 面对大量无序的信息,如何快速,准确,经济地找到所需的信息已成为人们迫切需要解决的问题.
搜索引擎概述
搜索引擎是一种新兴的网络工具,可以满足人们对网络信息的搜索需求. 它使用网络的自动搜索功能来建立索引,建立并了解各种信息资源. 提取,组织和处理,以发挥信息导航的作用,帮助人们从不同形式的数字信息中进行搜索.
搜索引擎起源于传统的全文信息检索理论. 狭义上的搜索引擎仅指基于Internet的搜索引擎. 广义上讲,搜索引擎还包括基于目录的信息检索服务. 搜索引擎的研究非常全面且具有挑战性. 它涉及许多领域的关键理论和技术,例如信息检索,人工智能,计算机网络,分布式处理,,数据挖掘,数字图书馆,自然语言处理等. 问题是的大小,索引的质量和索引的质量.

搜索引擎的工作原理和分类
搜索引擎包括四个部分: 搜索器按工作原理划分 常见的搜索引擎,索引器,搜索器和用户界面. 它使用称为“蜘蛛”的机器人程序以某种策略自动搜索信息,然后索引器理解并处理该信息,从中提取索引项,建立索引库,然后搜索器根据用户的索引进行索引查询. 快速检索库中的文档,评估相关性,对要输出的结果进行排序,并根据用户的查询需求提供合理的反馈. 用户界面接受用户查询,显示查询结果,并提供个性化查询项目. 根据信息收集和服务交付的不同方法,搜索引擎可以分为:

1. 全文搜索引擎
全文搜索引擎是一个名副其实的搜索引擎,可以从各种网站中提取信息,构建,检索符合用户查询条件的记录并按特定顺序返回结果. 全文搜索引擎的自动信息收集功能分为两种: 一种是常规搜索,即每次搜索引擎主动发送一个“蜘蛛”程序来检索特定IP地址范围内的Internet站点,然后一次. 找到一个新的网站,它将自动提取该网站的信息和URL,并将其添加到自己的中;另一种是提交网站搜索,即网站所有者主动将URL提交给搜索引擎,该引擎会在一定时间内(从2天到几个月不等)将您定向到您的网站,该网站发出“蜘蛛”程式. 全文搜索引擎中最具代表性的是国外著名的Google和国内的百度搜索.

2. 目录索引
目录索引是手动或搜索引擎. 在查看了信息之后,编辑器手动形成信息摘要,并将信息放入预先确定的分类框架中. 由于目录索引只是按目录分类的网站链接列表,因此不能称为严格的搜索引擎. 因为将人的智能添加到目录索引中,所以导航质量高并且信息更加准确,而且因此,维护成本太大并且信息无法及时更新. 目录索引中最具代表性的是Yahoo和Sina.
3. 元搜索引擎
元搜索引擎没有自己的数据,但是同时将用户的查询请求提交给多个搜索引擎,处理返回的结果,并将它们作为自己的结果返回给用户. 元搜索引擎返回的信息量更大,更全面,但是所使用的搜索引擎的功能无法充分利用,用户需要进行更多的筛选. 元搜索引擎的代表是WebCrawler,信息市场等.


搜索引擎的发展现状和技术前景
目前,搜索引擎通常通过单个搜索方法提供用于全文搜索和关键字的分类浏览的查询方法. 类别浏览经常检索大量不相关的信息,查全率和查准率不高;关键词检索仅是机械词匹配,缺乏知识处理能力和理解能力,信息检索质量不高. 此外,搜索功能和应用的局限性,排名技术指标单一,分类目标系统缺乏标准化以及信息处理深度不足等都严重影响了搜索引擎的发展. 因此,必须增加检索方法,加强网络信息资源的科学索引和组织,促进网络资源标准化进程,积极促进搜索引擎的发展.
1. 精确的搜索技术
使用基于自然语言理解技术的智能搜索引擎来加深对用户搜索请求的理解;通过不断了解和分析用户提供个性化搜索;使用XML和其他技术来结构化信息,结构化查询并提高检索的速度和性能;建立针对特定行业,特定主题和特定领域信息的搜索,以提高搜索的准确性.
2. 对等搜索技术

对等(Peer To Peer)技术是以用户为中心的,通过P2P共享文件,目录,甚至是硬盘上的整个硬盘. 此概念专门应用于搜索引擎技术,因此用户不必浏览Web服务器. 不受信息文件和主机设备格式的限制,深度搜索将极大地提高价值. 信息.
3. 跨语言检索技术
跨语言信息检索意味着用户以其母语提交查询,搜索引擎在中以多种语言进行信息检索并返回所有可以回答用户问题的语言的文档. 如果添加了机器翻译,则结果可以以母语显示. 该技术仍处于初步研究阶段. 主要困难在于语言之间表达和语义对应的不确定性. 但是,对于当今的经济全球化和跨越国界的互联网而言,它无疑具有重要意义.

4. 移动代理技术
Mobile Agent(移动代理)技术是一种新型的分布式计算技术,是指网络上具有移动功能的程序,该程序可以自主运行并根据用户要求完成指定的任务. 在移动代理模式下,客户端不再向服务器提交简单的请求,而是向其中包含代码和数据的移动对象提交. 移动对象代表用户,并根据“程序接近数据”的原则在服务器之间自主移动,以完成数据处理任务. 基于移动代理模型的应用程序可以大大节省网络带宽,有效克服网络延迟引起的各种问题,并且可以智能,自主地异步执行. 克服了传统的搜索引擎“接近程序数据”操作模式,大大减少了网络数据流量,节省了网络资源.
发展前景
随着上海信息社会的发展,搜索已成为在网络生活中组织和控制网络信息资源的有效工具. 使用搜索引擎来加速信息传播,整合有用的知识并提高信息利用率已成为大多数用户的共识. 我们应该更好地利用搜索引擎,实现信息服务的人性化和效率化,为用户检索信息提供更大的便利.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-235110-1.html
网商是大趋势