春山 征吾のくけー

https://www.unixuser.org/~haruyama/blog/ に移転しました http://wiki.livedoor.jp/haruyama_seigo/d/FrontPage @haruyama タイトルが思いつかないときはそのときかかってた曲をタイトルにしています.

2012年12月

渋谷.clj 2012/12/23(日) を開催します. #渋谷clj

どうにか人数が集まったので 渋谷.clj 2012/12/23(日) on Zusaar を開催します. ミクシィの会議室を使います.

参加者はまだまだ募集中です. Clojure 書きましょう!

Anuenue-0.8.1 と StandardPlusTokenizer

2012/12/17 anuenue-wrapper - A Search Package with Apache Solr - Google Project Hosting 0.8.1 をリリースしました.

0.8.1 では, デフォルトのcore で拙作の StandardPlusTokenizer を利用できるようにしました.

Lucene/SolrのStandardTokenizerは, 記号などの文字を捨ててしまいます. 「つのだ☆ひろ」の「☆」がなくなっているのが見えます.

text_cjk

StandardPlusTokenizer は, 空白文字以外の文字をすべて切りだします. 「つのだ☆ひろ」の「☆」は残ります.

text_cjk_plus

 
QRコード
QRコード
  • ライブドアブログ