什么是全文检索全文检索的简介

2024-03-27 12:56:44   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《什么是全文检索全文检索的简介》,欢迎阅读!
全文检索,简介,什么
什么是全文检索全文检索的简介

全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。那么你对全文检索了解多少呢?以下是由店铺整理关于什么是全文检索的内容,希望大家喜欢! 全文检索的简介

基本介绍

全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。

与之相关的议题 语根处理 (stemming)

符素解析器 (token parser) 1-gram, 2-gram , n-gram 断词/分词 word segmentation 倒排索引 inverted index 算法、搜寻策略之模型 布尔式 boolean

统计模型 Probabilistic model 向量空间模型 vector base model 隐性语义模型 Latent semantic model 系统检索的介绍

评量之准则

判断检索效果的两个指标:

查全率=被检出相关信息/相关信息总量(%) 查准率=被检出相关信息/被检出信息总量(%) 开放源代码之全文检索系统 Apache Solr BaseX


Clusterpoint Server(freeware licence for a single-server) DataparkSearch Ferret Ht-//Dig Hyper Estraier KinoSearch Lemur/Indri Lucene mnoGoSearch Sphinx Swish-e Xapian ElasticSearch 议题优化的概念

和中文有关的议题 断词(分词) 语法解析 古籍议题 多语言混合 优化

剔除字(Stopwords) 词性标注

权威档(authority file) 知识体系,本体论(ontology) 超链接分析(page rank)技术 历史及未来之趋势 自由语句搜寻 基于自然语言的分词


本文来源:https://www.wddqxz.cn/347f61da6237ee06eff9aef8941ea76e58fa4add.html

相关推荐