step4用のbatスクリプト
説明
更新用。
PDF形式の文書ファイルをutf-8テキストファイルに変換する。
rule.json
の記載により、対応するファイルに対して実行される。
process_files.py
から直接呼び出される。
pdf_to_text.py
を、引数丸投げで呼び出す。
Windows専用のbatファイル。
使用方法
第1引数 = 変換したいファイルのフルパス。 第2引数 = 変換先フォルダのフルパス。
コード
call python2.bat > NUL python pdf_to_text.py --normalize %*