step4用のbatスクリプト

説明

更新用。 PDF形式の文書ファイルをutf-8テキストファイルに変換する。 rule.jsonの記載により、対応するファイルに対して実行される。 process_files.pyから直接呼び出される。 pdf_to_text.pyを、引数丸投げで呼び出す。 Windows専用のbatファイル。

使用方法

第1引数 = 変換したいファイルのフルパス。 第2引数 = 変換先フォルダのフルパス。

コード
call python2.bat > NUL
python pdf_to_text.py --normalize %*