Pythonコード
以下のコードを「Get_lang_jp.py」として保存。
import sys
import re
def main():
#引数の確認
args = sys.argv
if(len(args) < 2):
print("引数:対象ファイルパス")
return False
Get_lang_jp(args[1])
def Get_lang_jp(input_path):
#出力用データ
output_list = list()
#データ読み込み
input_file = open(input_path, "r", encoding="UTF-8")
input_list = input_file.readlines()
input_file.close()
#データの分類
for data in input_list:
contain = re.findall("[ぁ-ん]|[ァ-ン]|[一-龥]", data)
if len(contain) != 0:
output_list.append(data)
#データの出力
output_file = open(input_path + "_lang_jp.txt", "w", encoding="UTF-8")
for data in output_list:
output_file.writelines(data)
output_file.close()
if __name__ == "__main__":
main()
動作確認
以下のようなテキストファイルを「sample.txt」として用意する。
関数A funcA() 関数B funcB() Sort関数 昇順に並び替え funcSort()
pythonファイルとテキストファイルが同じディレクトリにあるとして、次のように実行する。
python .\Get_lang_jp.py .\sample.txt
実行すると「sample.txt_lang_jp.txt」というファイルが作成されて、中身は次のようになる。
関数A 関数B Sort関数 昇順に並び替え
最後に
アルファベットと日本語が混ざったテキストファイルから、日本語が含まれている行だけを取り出す必要があったため、pythonで手軽に実装しました。
こういう用途でさっと作るにはpython便利。


コメント