可以证明在聚乙烯食品包装薄膜和聚乙烯或聚丙烯砧板、台面、垃圾桶和运输箱材料中添加使用抗菌剂是非常有效的。虽然必须对用于食品和食品服务的包装进行更多深入的研究,但工业上已经成功地将其专有技术应用于聚乙烯和聚丙烯吹塑、流延薄膜以及其他聚合物中。气体释放系统消除了香囊包意外破裂和被误食的风险。气体释放抗菌包装系统的一个应用就是将一种特定的气体成分用在浆果和葡萄包装盒内,可以保鲜和控制霉变的产生。......
2025-09-29
搜索引擎(Search Engines)指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制,例如Yahoo!、Alta Vista、Infoseek、Excite和搜狐(Sohu)等。它们可看成是网络信息检索工具的典型代表,一般包括数据采集标引机制、数据组织机制、用户检索机制。
搜索引擎的数据采集机制按照一定规律和方式对网络上WWW站点进行搜索,并将搜索到的WWW页面信息存入搜索引擎的临时数据库;搜索引擎的数据组织机制对WWW页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库;搜索引擎的用户检索机制帮助用户用一定方式检索搜索引擎的索引数据库以获得符合用户需要的站点或页面。我们可将搜索引擎看成一个双层C/S结构的体系:当用户访问搜索引擎时,用户端为客户机,向搜索引擎提出检索请求,搜索引擎为服务器,检索自己的索引数据库并将检索结果以应答形式提交给用户。
1)搜索引擎的数据采集机制
搜索引擎的数据采集一般都是通过“网络蜘蛛”来实现的。网络蜘蛛也叫“网络爬虫”,是搜索引擎的核心,其工作原理可由图2-2表示:

图2-2 网络蜘蛛原理图
蜘蛛模块的作用就是从Internet上抓取Web页面和Web文档,形成用户想要创建的集合。整体核心是那些“小蜘蛛”,即搜索代理,连接到Web服务器并下载文件。这些蜘蛛都是用多线程方式编写,为了同时连接到多个Web Servers。每个蜘蛛都会从相应的URL队列中获得第一个URL并试着下载那个页面。
所搜集的文件被送到Spider Master(控制所有蜘蛛的对象),这些文档再传递给ContentHandler(内容处理器)。ContentHandler负责检查下载下来的文档并保存到本地磁盘。ContentHandler会通过叫做ContentSeen的哈希表核查是否这些文件在以前的镜像网站上存在。经过哈希表校验后,又会经由ContentFilter(内容过滤器)进行相关处理。Filter包括两个用户定义的列表:一个好的term list和坏的term list。允许用户自行控制文档集合的质量和相关度。一个独有的item id会被分配给每个文档并且索引会存储在Item Index中。
如果文档是HTML文件,HTML Parser会从文件中提取所有的URLs,然后传给URLHandler处理。这些URLs会通过Robot Exclusion协议进行排除。如若URL通过了检查,又会进一步被URL Filter核实。URL Filter也包括两个好坏列表,由正则表达式详细指明。
如果一个URL通过了所有的检查,就会被加到URL queues队列中,同时蜘蛛会以bread-first广度优先的顺序进行Web Documents的搜索。
2)搜索引擎的数据索引机制
搜索引擎的数据组织主要是利用强有力的数据库管理系统来组织所采集标引的网页信息,形成索引数据库。数据库中的一条记录基本上对应于一个网页,原则上包括关键词、网页摘要、网页URL等信息。由于各个搜索引擎的标引原则和方式不同,所以它们的索引记录内容(即使针对同一网页)可能很不相同。搜索引擎的数据组织模块还和数据采集标引模块一同实现索引数据的动态维护,例如针对不断更新内容的网页和不断变更的网页地址,对索引数据进行及时的更新、添加、删除等处理,以保证索引数据库准确反映网络信息资源的当前状况。
索引器通过抽取文档中的术语,以及记录这些术语与文档间的关系,创建了可搜索的文档索引。由于Web上出现的各种各样的文档格式,诸如HTML、MS Word、PDF等,索引器也应该能以不同的格式处理这些文档。
索引机制的设计原理如图2-3所示。(https://www.chuimin.cn)

图2-3 索引结构原理图
(1)Indexer Master首先检查由蜘蛛模块创立的Item Index,看究竟搜集了多少文件及其在本地磁盘中的存储位置。
(2)每个文档信息被发送给合适的Parser解析器,将文件转换为一致的索引文档对象。
(3)每个文档对象又传给DocIndexer索引。特别地,DocIndexer会将文档进行分词,然后创建一个索引记录这些出现在一个文档中的词语。相关的位置信息以及每个词的频率也相应地记录下来。
(4)索引创建后会自动存储在Index Structure中,并转化成Inverted Index“倒排索引”。与此同时,原先的索引会映射一个文档到包含在此内的词汇列表中;而倒排索引旨在映射一个单词到包含此单词的文档列表中。
当用户查询输入到搜索引擎中时,这就实现了Fast Retrieval快速检索。
3)搜索引擎的用户检索机制
搜索引擎的数据检索机制主要包括四个部分:
(1)检索界面模块,接受用户检索要求,往往分为一般检索界面和高级检索界面;
(2)检索策略模块,将用户输入的检索要求编制成计算机可执行的规范化检索式;
(3)检索执行模块,利用检索式检索索引数据库,并保证检索的速度和准确性;
(4)检索结果组织模块,对检中记录的整理组织。
相关文章
可以证明在聚乙烯食品包装薄膜和聚乙烯或聚丙烯砧板、台面、垃圾桶和运输箱材料中添加使用抗菌剂是非常有效的。虽然必须对用于食品和食品服务的包装进行更多深入的研究,但工业上已经成功地将其专有技术应用于聚乙烯和聚丙烯吹塑、流延薄膜以及其他聚合物中。气体释放系统消除了香囊包意外破裂和被误食的风险。气体释放抗菌包装系统的一个应用就是将一种特定的气体成分用在浆果和葡萄包装盒内,可以保鲜和控制霉变的产生。......
2025-09-29
在西美尔看来,时尚的发生机制和传播机制是密不可分的。较低阶层模仿较高阶层时尚的过程就是时尚从较高阶层向较低阶层进行传播和扩散的过程,在信息不发达的资本主义初期,这种时尚传播速度是比较缓慢的,所以后来有学者将这种传播方式称为“滴流论”。当然,由上而下的时尚传播机制始终存在,只是在新媒体的助力下传播速度大大提高,用“滴流”二字只能显示其传播方向,而无法反映其传播速度。......
2025-09-29
结构不完善的激励机制可能会无意间影响到整个网络的绩效。建立激励机制应遵循一定的原则。首先,为了防止搭便车的行为存在,激励机制应该与结果而不是与供给主体的活动挂钩。有效的激励机制还能避免供给主体的“扒皮”行为。扒皮行为是指供给主体快速抽取最容易办理的案件,而将难度大的案件留给其他伙伴去处理。[58]总之,完善的激励机制能够带来较高的合作供给的绩效。......
2025-09-29
为了简化分析和降低建模难度,做如下假设:图15-7 WPA包格式15.3.1.1 认证WPA认证与IEEE 802.1x规范相一致,它为集中型用户和/或无线网络认证提供了可扩展的认证协议,同时也提供了加密密钥管理和分发功能。使用WPA的接入点支持广播信标消息。......
2025-09-29
R14、R15的电阻值应为式中,VSVO为设计输出电压,也是PFC的输出电压;VEAO为FAN4803设置的5V标准电压;IPCM为FAN4803片内变换电流。......
2025-09-29
下面再来分析一下第四种观点:时尚与艺术之间没有太大的分歧,甚至艺术还是时尚的一部分。问题是,这些定义仍然无法解决人们在思考时尚问题时所面对的困扰,因为除了与服饰文化及艺术相关之外,时尚问题与心理学、美学、哲学、传播学、社会学、经济学、甚至科学都有关系。显然,在鲍德里亚看来,时尚机制的运作逻辑就是一种死亡和再生交替出现、死亡也是再生的再循环逻辑。......
2025-09-29
1928年,印度物理学家拉曼发现了拉曼效应:光通过介质时由于入射光与分子运动相互作用而引起的频率发生变化的散射。在量子理论中,把拉曼散射看作光量子与分子相碰撞时产生的非弹性碰撞过程。图5-1光量子与分子相互作用示意图拉曼散射共分为两个类型[2]。......
2025-09-29
鲍德里亚把时尚与现代性联系起来,现代性的主要标志是决裂、进步和更新。鲍德里亚认为这是时尚特有的现实性,不是现实的参照,而是即时的完全再循环。所以,在鲍德里亚看来,时尚对于旧形式的抽象创新就等于回收了死亡的欲望本身,使得时尚开始一次又一次的无害循环运动。时尚机制的运作逻辑就是一种死亡和再生交替出现、死亡也是再生的再循环逻辑。......
2025-09-29
相关推荐