標準のディレクトリ構造
導入と設定の手順どおりに入れた前提で説明する。
- a
- 一つのデータのセット。元データ、テキストデータ、インデックスデータ、検索用プログラム、インデックス構築用プログラムを含む。 インデックスを構築する際に利用するスクリプトのファイルが多数入っている。 同じようなセットを、b, c, 等複数入れ、それぞれを独立して扱える。step1env.bat にて変更可能。
- bin
- Python言語など、ソフトウェアの導入先。
- original
- 検索の対象とする文書ファイル群の置き場。step1env.bat にて変更可能。
- tmp
- 一時ファイル置き場。ppt-to-text.bat などが使用する。step1env.bat にて変更可能。
- a/jsngram
- JsNgram バックエンド。Python用ライブラリ。インデックスを構築する際に呼び出される。直接利用することはない。
- a/pub
- 配布用データのセット。元データ、テキストデータ、インデックスデータ、検索用プログラムを含む。 このフォルダごと、コピーして持ち出せば、どこでも検索できる。
- a/pub/docs
- この説明書が入っている。
- a/pub/db
- 検索対象の元文書群を、そのままコピーしたものが格納される。検索結果から、ここにリンクしており、呼び出すことができる。
- a/pub/idx
- 検索用のインデックスが格納される。これを利用して、高速検索を行う。インデックスは、バックエンドのデータ更新で作成する。
- a/pub/txt
- 検索時のプレビュー表示で使用するテキストファイルが格納される。テキストファイルは、バックエンドのデータ更新で作成する。