step4用のbatスクリプト
説明
更新用。
PDF形式の文書ファイルをutf-8テキストファイルに変換する。
rule.jsonの記載により、対応するファイルに対して実行される。
process_files.pyから直接呼び出される。
pdf_to_text.pyを、引数丸投げで呼び出す。
Windows専用のbatファイル。
使用方法
第1引数 = 変換したいファイルのフルパス。 第2引数 = 変換先フォルダのフルパス。
コード
call python2.bat > NUL
python pdf_to_text.py --normalize %*