磁力泵厂家
免费服务热线

Free service

hotline

010-00000000
磁力泵厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

硅谷杂志浅谈个性化元搜索引擎技术新日

发布时间:2020-01-15 09:28:11 阅读: 来源:磁力泵厂家

【硅谷网11月4日文】据《硅谷》杂志2012年第16期刊文称,搜素引擎技术这几年的发展速度非常快,同时应用的也非常广泛,可以说搜索引擎改变人们上网的体验,能够更准确的帮助广大用户能够定位自己需要的内容和知识,而且搜索引擎为提供更准确的搜索结果,也已经开始逐步融入智能化搜索引擎技术,而这一切都是建立在元搜索引擎技术基础上的,重点就是探讨个性化元搜索的几个关键性的技术。

1元搜索引擎的概念分析

元搜索引擎实际上是通过统一的用户界面来帮助用户在多个搜索引擎中寻找合适的搜索引擎来进行检索的基础,元搜索引擎是针对分布于计算机网络里的多种检索工具的全局控制,相对于元搜索引擎来说,可以被利用的独立搜索引擎又被称为“源搜索引擎”,众多的独立搜索引擎仅仅是元搜索引擎的工具。

因此元搜索引擎拥有自己独特的特征,一个元搜索引擎的操作过程是将用户的关键词提交给多个数据库,然后元搜索引擎就会调用多个独立搜索引擎对用户的关键词进行检索,元搜索引擎将会对不同数据库的检索进行管控转化,以实现最佳结果的匹配。元搜索引擎的结果是基于独立搜索引擎的查询结果,仅仅有少数的情况是直接调用原始的结果,比如对多个独立搜索引擎检索的结果进行重新排序和重复的数据进行删除工作。

因为元搜索引擎的结果是基于独立搜索引擎,所以在功能上将会受到独立搜索引擎的限制,目前元搜索引擎通常是检索的覆盖比较广,但是检索的准确率却不容易控制,而个性化技术的发展则能够较好的解决这一点,实际上个性化元搜索技术更多的融入了智能系统,能够和用户进行互动式搜索,从而更容易掌握用户的搜索需求。

2个性化元搜索引擎的运作机理

目前元搜索引擎的种类有很多,其中以操作平台来区分,则分为基于系统软件的桌面型元搜索引擎和基于互联网的元搜索引擎,个性化元搜索引擎主要是用户利用多个独立搜索引擎进行网络搜索的一个中介,在检索前,元搜索引擎会通过和用户进行互动来动态获取用户的检索请求,这种方式将能够准确的获取用户的信息,然后再调用相应的独立搜索引擎进行搜索,然后个性化元搜索引擎利用自身的技术改进,在模糊查询以及相关智能算法技术方面的改进,从而更好的进行索引,筛选和排列,甚至能够屏蔽一些垃圾网站信息,现在谷歌的熊猫算法就是一种典型的个性化搜索引擎技术。从提问到结果反馈的这个过程中,个性化搜索引擎将会遵循下面三个机制进行运行。

2.1个性化元搜索的选择机制

个性化元搜索引擎在执行对关键词的查询之前,会对搜索引擎列表进行初始化,然后结合动态获取的用户需求信息来调用相应的独立搜索引擎,目前选择的方式有两种,分别是系统选择和用户选择,系统性选择主要是依靠个性化元搜索对各种独立搜索引擎的功能效率的评价,元搜索引擎系统会自动匹配功效最佳的独立搜索引擎,而用户选择则是用户通过浏览搜索引擎列表的方式来实现自主性选择,但是对于用户来说,独立搜索引擎相对比较复杂,用户往往无从选择,不过现在已经有了检索时间和结果数量等选择,且具有一定的记忆性,对于这些较为简单的个性化选择基本上已经实现。

2.2个性化元搜索的转换机制

这里主要包括两部分的内容,第一要把用户的查询需求转化成符合各独立搜索引擎的标砖查询语言格式,第二要把个独立元搜索的查询结果转化成统一的输出格式,因为每一种独立搜索引擎的检索算法和数据库的结构都会存在相应的差异,不同的独立搜索引擎的布尔检索,截词检索的算法和复杂度是不一样的,而且有的独立搜索引擎还能够支持自然语言的查询,所以这些不同的检索算法会产生不一样的格式,个性化元搜索引擎不仅仅要精确的掌握它们调用CGI的格式,还具备了自然语言等高级查询能力,对各种独立搜索引擎的检索结果进行二次排序,筛重,从而提供给用户匹配度更好的搜索结果。

2.3个性化元搜索引擎的排列机制

我们知道从百度和谷歌上查询的结果都是以一定顺序排列的,这些排列顺序会根据网站权重,网站关联度等决定的,现在也有了针对优化网站排名的SEO职业,这说明元搜索引擎的排序都是遵循着一定的机制原则,只有符合这类机制才能够让网站获得更好的排名,目前个性化元搜索技术对检索结果的排序分为引用排列和重新排列两种方式,引用排列指的是直接引用独立搜索引擎检索结果进行排序,会根据不同的来源将结果显示出来,这种方式不需要对结果筛重,只需要将格式转化过来就可以了,这种方式存在一个缺陷,就是容易将和用户查询结果相关度不大的反而排在了相关度大的前面,让用户错过了正确的结果,因此个性化元搜索技术还配置了对结果进行重新排列,同时对结果进行更多的处理,根据更好的自然语言的查询技术,优化了结果的排序,让用户更容易准确的找到相应的内容。

3个性化元搜索主要技术分析

个性化元搜索的核心就是能够提供个性化准确的服务,要解决如何调用其他搜索引擎索引数据库,如何获取通过个性化互动获取的关键词在其他搜索引擎中的查询结果,以及对这些结果的评价排序和显示,解决这类问题,目前主要是通过下面四种关键技术来实现的。

3.1个性化的用户搜索转化

个性化元搜索引擎将对单一的搜索框进行革新,会有更多的互动内容让用户选择,而且搜索词也不再是单一的词汇或者一个长尾关键词,而是由更多的词汇组成,当用户将自己的需求通过个性化的搜索界面输入之后,元搜索引擎就会对这些词汇进行语言上的转换,变成独立搜索引擎可以检索的查询语言表达式,因为不同的独立搜索引擎会有不同的检索语法和操作符,因此个性化元搜索还需要对用户的需求进行相应的转换,而且这种转化是智能匹配的,对于用户来说并不会感到这一点。

3.2检索机制设计和优化技术

对于个性化搜索引擎的初始化方式,以及各个独立搜索引擎结果平衡的处理等,都需要在检索机制的设计初期进行规划,这时候主要会受到检索的速度以及用户对检索结果的满意度的影响,目前个性化搜索一切宁的初始化主要包括用户参与,系统智能化确认以及智能随机处理等方式。而检索的结果处理则要衡量不同搜索引擎结果之间的相关程度,目前个性化搜索引擎的处理主要是以记录为单位,然后通过判定某一个记录在多个独立搜索引擎中的评价指数,如果多个独立搜索引擎都推选这个结果,那么这个记录就应该排在结果的前面,实际上利用到了物以群分人以类聚的原则,当别人都认为这个结果好,那么这个结果就应该优先出现,从而实现更加准确的匹配。

3.3检索结果的显示

这实际上是利用了个性化元搜索的排列机制,目前个性化元搜索基本上摈弃了传统元搜索技术的简单模式,比如直接引用多个独立搜索引擎的结果,造成很多页面的重复,而是结合了直接引用和动态调整两个方面技术,当一些重要的结果,往往会采用多方引用,这就是为什么我们能够在搜素引擎上依然能够看到相同内容的原因,另外就是个性化元搜索引擎会对结果进行更多的加工,主要包括两种方式,一种是对记录的筛选,对于很多重复的数据记录进行删除,这就是为什么我们能够看到互联网垃圾网站采集的数据很多,为什么这些垃圾网站的数据并不能够通过搜索引擎显示出来的主要原因,另一种就是对结果进行再次排序,这时候个性化元搜索引擎会结合对结果的再次智能化的判断,识别这些内容网站的本身权重和用户体验度,从而进行优先显示,这就是为什么很多用户体验度好,搜索引擎友好度好的网站内容往往能够获得更好的排列的原因所在。

3.4分布式数据库的调用技术

这是个性化元搜索技术的核心,也是非常重要的一部分,因为独立搜索引擎的数据库分布在不同的地域,而且数据的结构也是不一样的,这时候只能够依靠分布式数据调用的技术将这些数据库的查询结果索引到分布式数据库中,而个性化元搜索引擎将会利用分布对象技术来对索引数据库进行访问查询和排序,正是如此,如果某些网站的响应速度慢的话,往往就不会获得更好的排名,因为不同数据库的掉用时间的不同,将会影响到显示的结果。

4总结

目前个性化元搜索技术还处于刚刚发展的阶段,很多技术都是在传统元搜索引擎技术进行改进和升级而来,同时也融入了智能化的搜素引擎技术,有效的提升了元搜索引擎结果的准确度,在不久的将来个性化元搜索引擎还会向着社会化元搜索引擎技术方向发展,从而让用户体验到元搜索引擎技术带来的网络工业革命。

(责任编辑:硅谷网·)

上一篇:百度设立互联网营销大学,让更多的人获取网络受益

下一篇:硅谷杂志:基于ASP.NET的移动Web应用探究 对“硅谷杂志:浅谈个性化元搜索引擎技术”发布评论

在线医生询问

预约挂号平台有哪些

网络挂号