標準のディレクトリ構造

導入と設定の手順どおりに入れた前提で説明する。

a
一つのデータのセット。元データ、テキストデータ、インデックスデータ、検索用プログラム、インデックス構築用プログラムを含む。 インデックスを構築する際に利用するスクリプトのファイルが多数入っている。 同じようなセットを、b, c, 等複数入れ、それぞれを独立して扱える。step1env.bat にて変更可能。
bin
Python言語など、ソフトウェアの導入先。
original
検索の対象とする文書ファイル群の置き場。step1env.bat にて変更可能。
tmp
一時ファイル置き場。ppt-to-text.bat などが使用する。step1env.bat にて変更可能。
a/jsngram
JsNgram バックエンド。Python用ライブラリ。インデックスを構築する際に呼び出される。直接利用することはない。
a/pub
配布用データのセット。元データ、テキストデータ、インデックスデータ、検索用プログラムを含む。 このフォルダごと、コピーして持ち出せば、どこでも検索できる。
a/pub/docs
この説明書が入っている。
a/pub/db
検索対象の元文書群を、そのままコピーしたものが格納される。検索結果から、ここにリンクしており、呼び出すことができる。
a/pub/idx
検索用のインデックスが格納される。これを利用して、高速検索を行う。インデックスは、バックエンドのデータ更新で作成する。
a/pub/txt
検索時のプレビュー表示で使用するテキストファイルが格納される。テキストファイルは、バックエンドのデータ更新で作成する。