KazMuzik.net
Music / Technology / Healthcare / Immigration / アメリカ
Google
 
<< MAIL-IN REBATE TRACKING PAGE #4 : 2007-10..12Google Search within Kaz Muzik Blog (domains=kazuomik.livejournal.com) >>

Lucene related subprojects - KazMuzik Blog
2008-03-02 21:01




このブログで、Lucene を使っていたのは、去年の 11月頃、英辞郎関連のプロジェクトでしたが、今年に入り、1/24 に 2.3.0 がリリースされ、さらに 2/23 には、serious な bug fix を含む 2.3.1 がリリースされました。



また、Lucene の subproject としては、Nutch や、Nutch のベースとなっている Hadoop がありましたが、Hadoop は 1/23 に Lucene から独立して、top level project に昇格しました。2/7 には、0.16.0 がリリースされています。ちなみに、Nutch の方は 4/12/1007 にリリースされた 0.9 のままです。



Hadoop には、HBase という Hadoop database の subproject が加わり、Hadoop 0.16.0 の contrib に含まれています。Google の Bigtable のようなものらしいです。

一方、Lucene にも、Tika や、Mahoutという subproject が加わっています。Tika は、既存の parser を使って、いろいろな文書から、metadata や structured text content を抽出する toolkit で、12/27/2007 に 0.1 がリリースされています。Mahout は、1/22 に launch したばかりで、いろいろなアルゴリズムの machine learning libraries を作成するようです。

Tags: computer_technology