大学IT网 - 最懂大学生的IT学习网站! QQ资料交流群:367606806
当前位置:大学IT网 > ASP.NET技巧 > Lucene.net入门学习(结合盘古分词)

Lucene.net入门学习(结合盘古分词)(1)

关键词:Lucene.net盘古分词  阅读(1171) 赞(17)

[摘要]本文是对Lucene.net入门学习(结合盘古分词)的讲解,对学习ASP.NET编程技术有所帮助,与大家分享。

Lucene简介

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

Lucene.net简介

Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。开发人员可以基于Lucene.net实现全文检索的功能。

Lucene.net工作原理

Lucene.net提供的服务需要两部分:索引文件的写入和索引文件的读取。

1写入流程
源数据字符串经过analyzer处理,将源中需要搜索的信息加入Document的各个字段中,并把需要索引的字段起来并存储。
将索引写入存储器,存储器可以是内存或磁盘。

2读出流程
用户提供搜索关键词,经过analyzer处理。(我们下面代码采用的是盘古分词 ,其相关分词原理 可以再它的官网上可以看到 http://pangusegment.codeplex.com/)
对处理后的关键词搜索索引找出对应的Document,用户根据需要从找到的Document中提取需要的Field。

Lucene.net安装

大家可以去官网看下:https://www.nuget.org/packages/Lucene.Net/3.0.3

盘古分词安装

盘古分词主页:http://pangusegment.codeplex.com/

下载:http://pangusegment.codeplex.com/downloads/get/144143

Lucene.net结合盘古分词使用

http://pangusegment.codeplex.com/downloads/get/144145

大家可以看到相关使用的案列

Lucene.net创建索引(结合盘古分词)

    /*code 释迦苦僧*/
    class Program
    {
        static void Main(string[] args)
        {
            Stopwatch sw = new Stopwatch();//加入时间统计
            //获取 数据列表
            PostBll bll = new PostBll();
            IList<PostInfo> posts = bll.GetAllPost();
            Console.WriteLine(posts.Count);
            //创建Lucene索引文件
            string IndexDic = @"D:\Lucene\post\";
            sw.Start();
            IndexWriter writer = new IndexWriter(FSDirectory.Open(IndexDic), new PanGuAnalyzer(), true, IndexWriter.MaxFieldLength.LIMITED);
            foreach (PostInfo item in posts)
            {
                Document doc = new Document();
                Field postid = new Field("PostId", item.PostId.ToString(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.NO);
                Field title = new Field("Title", item.Title.ToString(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.NO);
                Field postscore = new Field("PostScore", item.PostScore.ToString(), Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.NO);
                doc.Add(postid);
                doc.Add(title);
                doc.Add(postscore);
                writer.AddDocument(doc);
            }
            writer.Optimize();
            writer.Commit();
            sw.Stop();
            Console.Write("建立" + posts.Count + "索引,花费: " + sw.Elapsed);
            Console.ReadLine(); 
        }
    }
«上一页12下一页»


相关评论