Archtea

0.5.7.6

いつまで経ってもマニュアルを書かないので(まぁ、私がなんだけど)、TomcatとStrutsのバージョンを上げてお茶を濁す。最大Term数に達したときのチェックもoptimizeを呼ぶときに、一緒にやるようにした(はず)。あれで、時間を食ってたら、Indexerの終了がだい…

0.5.7.5

をUpした。再現しないBugがあったけど、多分これが怪しいって思ったのを作ったら直った。良かった。というか、テストケース作ってなかったけど、日に日にこれが怪しいって思って試行錯誤したら、なんでUIDに改行コードを使ったのか思い出した。Lucene内文書…

0.5.7.3

ちょい前に0.5.7.2を出していたが、もろばぐってた。時間のロールについて勘違いしてて、コードが思いっきりまちがってた。Calendar.roll()って、時間が 23 -> 次の日の 0 になったら順次日付、月、年も変わっていくとすっかり勘違いしてた。Javadocを読み直…

Lucene 2.1

を試してみた。が、Highlightの動作が変わってるらしく、テストが3つ動かなくなった。しくしく。ここ苦労したんだよなー。追記: Highlighterの次の変更が影響してるっぽい。うーんこれ仕様変更なのかな。 From(Lucene 2.0) startOffset = tokenGroup.startOf…

0.5.7.1

をリリースした。Indexerをプロパティで設定して選べるように変更した。も少し書くと、場面によって要求も変わるだろうから、単一のインデックスで更新するか、複数で作成して最後にマージするかを選べるようにした。デフォルトは単一でやる場合。ただし、単…

マージインデックスは遅いかも?

残念ながらインデックスマージは遅いようです。元の方式に戻したほうが平和そうな予感がします。。そもそもボトルネックがディレクトリ内のファイルの一覧とかを取り出すほうにあるみたいで、いくらインデックス側のスレッドをなんとかしても、残念ながら...…

0.5.7

をアップしてみました。0.5.6.xじゃなくて0.5.7にしたのは気分の問題だが、設定ファイルの定義を変えたのでちょっと上げてみましたぐらい。いまんとこ、互換性はあるけど、そろそろ設定ファイルも完全に書き直したほうが...という気もしている。それより、UI…

0.5.6.3 ... あぷしてしまいますた。。

ファイルをアップしたにもかかわらず、ほぼ1日後にまたアップした。今回は、XMLファイルの場合に、XPathでFieldに格納するような機能を追加した。お手軽機能だが、XPathでうまいことテキストとして取得できないと動かないかも。あと、検索後のサマリをちゃん…

0.5.6.2 をリリースしてみた。

数字的にはちょこっとだが、Indexerは、半分ぐらい変更した。インデックスファイルに保管するUID(一応ユニークになってるはず...)フォーマット変更しちゃったので、新規作成したほうが良いかも。新規作成しなくても動きそうな気はするけど。。。具体的には、…

0.5.6.1 をUpしてみた。

いくつか、Bugを修正し、Index作成中にファイルを更新しているとどんどんメモリを消費していく問題に対処。ただ、これをしたら、今度は、更新されたファイルがインデックスに入らないようになった。しかも、古いやつも削除しちゃうから、実質だめなんじゃね…

Archtea 0.5.5.3

なんか、ちょこちょこバージョンアップしてますが、新しいのをリリース。複数検索時に枠を表示するようにしてみた。あと、Luceneの IndexWriter って、メモリサイズとの兼ね合いなのか、1文書につき(ほんとはちょっと違うけど)、単語 10000 までしか登録でき…

Archtea 0.5.4

をリリース。0.5.2 から 0.5.4 だが、0.5.3 は10分ぐらい存在していた(笑。リリース直後に、Luceneが 2.0.0 を使うようになっていたのを忘れていた。そのため、indexerの MANIFEST ファイルを修正しなければいけなかったのを忘れいてた。いつも間違えるが、…

すこし

Rss2.0用のコードを書く。ちょっとづつ、こっちも進めないとね。

少しずつ進めてみる

コード検索やらそのほか色々調べていたら触る時間がなくなってしまった。次に何をやる予定かはほぼ決まっているので、それを少しづつ進めないと。とりあえず、RSS/Atomで結果を返せるようにすることと、OpenSearch1.1についても対応しないと。その後は、PDF…

今月は

ほとんど手をつけられず。色々考えていたコード検索の方をがんばってみようと思って、格闘中。さて、どうなることやら。

Bug発見

0.5出してすぐにBug発見。orz。ローカルホスト(自分自身)のOpenSearchDescriptionの読み込みを初期化時にやってしまう設定だと、起動途中でリクエストを受け付けていないにも関わらず、リクエストしちゃう。その為、そのリクエストがタイムアウトするまで起…

とりあえず、Archtea 0.5 をリリース

もうちょっと、手を入れたかったけど、この辺で一区切り。というか、ユーザ個別の設定なんてまったく手を入れず。というか、まだまだ先だろう。とりあえず、変わったところといえば: ロゴを入れた。 マニュアルを入れた。 WebUIを少し改善した。 細かい修正…

OpenSearch 1.1

Open Search 1.1 Specifications のドラフトが出ていたのね。知らなかった。あまり、詳しく読んでないけど、調べて、対応することにしよう。Open Search 1.0 に対応しているといっても、実は、ShortName とかその他のパラメータはさっぱり、使っていなくて、…

Docbook

Archteaの設定について何も書いていない。なので、Docbookを利用してマニュアルらしきものを書いてみることにした。 Docbook は、Googleで調べれば色々でてくるけど、SGMLやXMLを利用して、文書を記述し、そこから様々な形式に変換して利用できて、とっても…

デイリービルド

作ろう、作ろうとおもって、ほっぽってた、デイリービルド(&テスト) をする為のスクリプトを書いた。(sourceforgeにあげるわけじゃないので、単なる自己満足だ。)今は、CactusとUnitテストが分離しちゃってて、ほんまは良くないんだろうけど、とりあえずの第…

文字コード判別

metaタグや、XMLの encoding で文字コードが判別していない場合に、とりあえず日本語を判別するコードを追加した。文字コードの自動判別って、簡単な方法では、結局 EUC-JP と Shift_JIS ( Windows-31J ) がかぶるから完全にはいかない。なので、その辺はま…

編集可能なラベル文字列の国際化

複数の検索をできるようにして、OpenSearchも使えるようにしたとしても、その選択用のタブ?にくる文字をどうするか悩む。簡単な方法として、OpenSearchのShortNameあたりを使えばいいような気もするが、いまのところ、このアプリでは、国際化にならない。と…

UIの細かいところ

UIをびみょーに変更したり、変更を試したり。ほとんど進んでない。UIはなかなか難しいねぇ。スタイルシートも使ってないやつとか、ちょっとおかしなのか混ざってるので、ちゃんと整理したほうがいいねぇ。

ロゴを作った

なんか、ロゴが無いのがさびしいので、作ってみた。あんまり凝った絵を書くには、才能もツールに対する習熟度も足りないので、シンプルなのを考えてみる。で、考えたのだが、どっかで見たことあるような....無いような....。まぁ、いいか。フォントは、 HB N…

少し修正版をリリース(0.4.2)

Indexerを改善したので、その辺をマージしたものをリリースした。一部、怪しい動きが見えたけど(いいのか?)、たぶん問題ないので、リリースした。アーカイブをスキップする機能を作ったので、複数のインデックスを作成していた場合でも、今までより早くなる…

Index更新の高速化

Index作成はまったく変わっていないのだが、IndexをUpdateする場合の動作を高速化した。といっても、アルゴリズムがどーのじゃなくて、ちょっとした小手先の技を使っただけだけど...。個々のファイルに対して、インデックスを作成していたら、それぞれのファ…

あまり進まず

幾つか調べ物をしてるので、それほどコードをいじらず。ログやら、プロパティのアクセスの大枠は、作ったけど、細かい対応は、、、、。やっぱり、こいうのを利用することをはじめから考えているなら、最初からそうしたほうが楽だ。というわけで、そっちはほ…

マニュアル系のドキュメントを食わしてみた。

Archteaのローカル検索では、Luceneをまんま使ってるんだが、マニュアル系のドキュメントをインデックスに追加するとどうも目次が上位に来る気がしてしょうがない。Rubyとかのマニュアルもテストしたりするのだが、検索後を例えばRubyとかにしちゃうと、目次…

設定を外部へ追いやってみる

と、テストが通らなくなった。プロパティファイルを活用しようと、設定をプロパティファイルからするようにしたら、今度は、テストをMockオブジェクト?というのかな、そのテスト用のクラスをダミーで作成していたので、そいつらは、プロパティファイルなん…

あれれ、設定が有効にならない。

せっかくQuery文字列などを変換する為のフィルタクラスと設定をつくったのに、そもそもの設定ファイルから読んでなかった...。orz。というわけで修正コードを作成。うーん。だから、検索がORばっかで、語句が増えるたびにヒット数も激増だったんだよね。。