Xapian 和 Lucene

2007-12-19

Xapian 和 Lucene的对比,摘自[python-chinese]
http://python.cn/pipermail/python-chinese/2007-January/034445.html

谢谢 Robert 的指路. 很同意社区活跃度应该是比较大的分别, 一些周边的小工具, lucene看起来比较多, 短期开发的可以省不少事,
两者核心效能可以想象不会差太远, 而且可能更多的是看自身的应用.

On 1/10/07, Robert Chen <search.pythoner at gmail.com> wrote:
>
> 没用过Xapian,但据我所知,Xapian
> 的历史要比Lucene悠久,而且在它背后有很多IR检索领域的专家,所以成熟度,稳定性应该不比Lucene差。
>
> 在功能方面,Xapian与Lucene应该不相上下,一般的索引建立,多种Query类型支持,Query解析,多文档格式支持都不在话下。
>
> 至于差别方面,可能最大的在于社区的活跃度,显然,Lucene的文档(中文文档)要比Xapian丰富一些,当然,这些不是太大的问题。
> 另外一个显著的差别在于Lucene是基于向量空间模型的检索模型,而Xapian
> 基于的是概率模型,当然这些模型的差别可能只是搞学术的需要关注的,实际应用中,检索结果差别应该不大。至于检索的效率,对于站内搜索而言,一般都可以胜任。
>
> 对于Python而言,Xapian通过SWIG可以支持Python,倒是Lucene的PyLucene,不知道其效率如何 :)
>
> 希望这些信息对你有帮助 :)
>
> On 1/9/07, ra do <rhapsodelico at gmail.com> wrote:
> >
> >  Re Liming_Do & 头太晕 : 用open source 的, 想尽量避免用旁枝的, 所以pylucene / Clucene
> > 暂不考虑
> >
> > Re Zhang Yunfeng : 请问 MoinMoin 你是指哪个 project , 有url吗 ?
> >
> > 或者我应该转问,  有没有人比较过lucene 跟xapian ? 各自的利弊是什么
> >
> >  On 1/9/07, 头太晕 <torrycn at gmail.com> wrote:
> >
> > > pyLucene不是一样用吗?
> > >
> > > 2007/1/9, Zhang Yunfeng <zeroslug at 163.com>:
> > > >
> > > > “ra do” < rhapsodelico at gmail.com> writes:
> > > >
> > > > > 最近在弄一个站内搜索, 在 lucene 跟 xapian 中选, lucene 支持好像好点, 周边的小工具也多,
> > > > 但本人不太想掺和 java 那摊事 ,
> > > > > xapian 是c++ 的, 但不知是个否一成熟的project, scalability 跟稳定性不知如何.  正犹豫中,
> > > > 所以想问问有用过 xapian
> > > > > 作为网站搜索的后台的吗 ? 如果有用, 又是如何跟python 对接的 ?
> > > >
> > > > MoinMoin正在开发的新版本好像是使用xapian作搜索引擎

分类:技术 | 标签: |

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注