base_8py_source.html

 #!/usr/bin/python3


 import argparse

 import allogate as logging

 import os

 from abc import abstractmethod

 from termcolor import colored

 from mm import MarkovModel


 class BaseCLI():

     """! @brief Base CLI class to handle user interactions

          @belongsto Python::Markopy

     """

     def __init__(self, add_help : bool=True):

         """!

         @brief initialize base CLI

         @param add_help decide to overload the help function or not

         """

         self.parserparser = argparse.ArgumentParser(description="Python wrapper for MarkovPasswords.",

         epilog=f"""{colored("Sample runs:", "yellow")}

         {__file__.split("/")[-1]} train untrained.mdl -d dataset.dat -s "\\t" -o trained.mdl

             Import untrained.mdl, train it with dataset.dat which has tab delimited data, output resulting model to trained.mdl\n


         {__file__.split("/")[-1]} generate trained.mdl -n 500 -w output.txt

             Import trained.mdl, and generate 500 lines to output.txt


         {__file__.split("/")[-1]} combine untrained.mdl -d dataset.dat -s "\\t" -n 500 -w output.txt

             Train and immediately generate 500 lines to output.txt. Do not export trained model.


         {__file__.split("/")[-1]} combine untrained.mdl -d dataset.dat -s "\\t" -n 500 -w output.txt -o trained.mdl

             Train and immediately generate 500 lines to output.txt. Export trained model.

         """, add_help=add_help, formatter_class=argparse.RawTextHelpFormatter)

         self.print_helpprint_help = self.parserparser.print_help

         self.modelmodel = MarkovModel()


     @abstractmethod

     def add_arguments(self):

         "! @brief Add command line arguements to the parser"

         self.parserparser.add_argument("mode",                             help="Process mode. Either 'Train', 'Generate', or 'Combine'.")

         self.parserparser.add_argument("-t", "--threads",default=10,       help="Number of lines to generate. Ignored in training mode.")

         self.parserparser.add_argument("-v", "--verbosity",action="count", help="Output verbosity.")

         self.parserparser.add_argument("-b", "--bulk",action="store_true", help="Bulk generate or bulk train every corpus/model in the folder.")


     @abstractmethod

     def help(self):

         "! @brief Handle help strings. Defaults to argparse's help"

         self.print_helpprint_help()


     def parse(self):

         "! @brief add, parse and hook arguements"

         self.add_argumentsadd_arguments()

         self.parse_argumentsparse_arguments()

         self.init_post_argumentsinit_post_arguments()


     @abstractmethod

     def init_post_arguments(self):

         "! @brief set up stuff that is collected from command line arguements"

         logging.VERBOSITY = 0

         try:

             if self.argsargs.verbosity:

                 logging.VERBOSITY = self.argsargs.verbosity

                 logging.pprint(f"Verbosity set to {self.args.verbosity}.", 2)

         except:

             pass


     @abstractmethod

     def parse_arguments(self):

         "! @brief trigger parser"

         self.argsargs = self.parserparser.parse_known_args()[0]


     def import_model(self, filename : str):

         """!

         @brief Import a model file

         @param filename filename to import

         """

         logging.pprint("Importing model file.", 1)


         if not self.check_import_pathcheck_import_path(filename):

             logging.pprint(f"Model file at {filename} not found. Check the file path, or working directory")

             return False


         self.modelmodel.Import(filename)

         logging.pprint("Model imported successfully.", 2)

         return True


     def train(self, dataset : str, seperator : str, output : str, output_forced : bool=False, bulk : bool=False):

         """!

             @brief Train a model via CLI parameters

             @param model Model instance

             @param dataset filename for the dataset

             @param seperator seperator used with the dataset

             @param output output filename

             @param output_forced force overwrite

             @param bulk marks bulk operation with directories

         """

         logging.pprint("Training.")


         if not (dataset and seperator and (output or not output_forced)):

             logging.pprint(f"Training mode requires -d/--dataset{', -o/--output' if output_forced else''} and -s/--seperator parameters. Exiting.")

             return False


         if not bulk and not self.check_corpus_pathcheck_corpus_path(dataset):

             logging.pprint(f"{dataset} doesn't exists. Check the file path, or working directory")

             return False


         if not self.check_export_pathcheck_export_path(output):

             logging.pprint(f"Cannot create output at {output}")

             return False


         if(seperator == '\\t'):

             logging.pprint("Escaping seperator.", 3)

             seperator = '\t'


         if(len(seperator)!=1):

             logging.pprint(f'Delimiter must be a single character, and "{seperator}" is not accepted.')

             exit(4)


         logging.pprint(f'Starting training.', 3)

         self.modelmodel.Train(dataset,seperator, int(self.argsargs.threads))

         logging.pprint(f'Training completed.', 2)


         if(output):

             logging.pprint(f'Exporting model to {output}', 2)

             self.exportexport(output)

         else:

             logging.pprint(f'Model will not be exported.', 1)


         return True


     def export(self, filename : str):

         """!

         @brief Export model to a file

         @param filename filename to export to

         """

         self.modelmodel.Export(filename)


     def generate(self, wordlist : str, bulk : bool=False):

         """!

             @brief Generate strings from the model

             @param model: model instance

             @param wordlist wordlist filename

             @param bulk marks bulk operation with directories

         """

         if not (wordlist or self.argsargs.count):

             logging.pprint("Generation mode requires -w/--wordlist and -n/--count parameters. Exiting.")

             return False


         if(bulk and os.path.isfile(wordlist)):

             logging.pprint(f"{wordlist} exists and will be overwritten.", 1)

         self._generate_generate(wordlist)


     @abstractmethod

     def _generate(self, wordlist : str):

         """!

         @brief wrapper for generate function. This can be overloaded by other models

         @param wordlist filename to generate to

         """

         self.modelmodel.Generate(int(self.argsargs.count), wordlist, int(self.argsargs.min), int(self.argsargs.max), int(self.argsargs.threads))


     @staticmethod

     def check_import_path(filename : str):

         """!

         @brief check import path for validity

         @param filename filename to check

         """


         if(not os.path.isfile(filename)):

             return False

         else:

             return True


     @staticmethod

     def check_corpus_path(filename : str):

         """!

         @brief check import path for validity

         @param filename filename to check

         """


         if(not os.path.isfile(filename)):

             return False

         return True


     @staticmethod

     def check_export_path(filename : str):

         """!

         @brief check import path for validity

         @param filename filename to check

         """


         if(filename and os.path.isfile(filename)):

             return True

         return True


     def process(self):

         """!

         @brief Process parameters for operation

         """

         if(self.argsargs.bulk):

             logging.pprint(f"Bulk mode operation chosen.", 4)

             if (self.argsargs.mode.lower() == "train"):

                 if (os.path.isdir(self.argsargs.output) and not os.path.isfile(self.argsargs.output)) and (os.path.isdir(self.argsargs.dataset) and not os.path.isfile(self.argsargs.dataset)):

                     corpus_list = os.listdir(self.argsargs.dataset)

                     for corpus in corpus_list:

                         self.import_modelimport_model(self.argsargs.input)

                         logging.pprint(f"Training {self.args.input} with {corpus}", 2)

                         output_file_name = corpus

                         model_extension = ""

                         if "." in self.argsargs.input:

                             model_extension = self.argsargs.input.split(".")[-1]

                         self.traintrain(f"{self.args.dataset}/{corpus}", self.argsargs.seperator, f"{self.args.output}/{corpus}.{model_extension}", output_forced=True, bulk=True)

                 else:

                     logging.pprint("In bulk training, output and dataset should be a directory.")

                     exit(1)


             elif (self.argsargs.mode.lower() == "generate"):

                 if (os.path.isdir(self.argsargs.wordlist) and not os.path.isfile(self.argsargs.wordlist)) and (os.path.isdir(self.argsargs.input) and not os.path.isfile(self.argsargs.input)):

                     model_list = os.listdir(self.argsargs.input)

                     print(model_list)

                     for input in model_list:

                         logging.pprint(f"Generating from {self.args.input}/{input} to {self.args.wordlist}/{input}.txt", 2)

                         self.import_modelimport_model(f"{self.args.input}/{input}")

                         model_base = input

                         if "." in self.argsargs.input:

                             model_base = input.split(".")[1]

                         self.generategenerate(f"{self.args.wordlist}/{model_base}.txt", bulk=True)

                 else:

                     logging.pprint("In bulk generation, input and wordlist should be directory.")


         else:

             self.import_modelimport_model(self.argsargs.input)

             if (self.argsargs.mode.lower() == "generate"):

                 self.generategenerate(self.argsargs.wordlist)


             elif (self.argsargs.mode.lower() == "train"):

                 self.traintrain(self.argsargs.dataset, self.argsargs.seperator, self.argsargs.output, output_forced=True)


             elif(self.argsargs.mode.lower() == "combine"):

                 self.traintrain(self.argsargs.dataset, self.argsargs.seperator, self.argsargs.output)

                 self.generategenerate(self.argsargs.wordlist)


             else:

                 logging.pprint("Invalid mode arguement given.")

                 logging.pprint("Accepted modes: 'Generate', 'Train', 'Combine'")

                 exit(5)


 class AbstractGenerationModelCLI(BaseCLI):

     """!

     @brief abstract class for generation capable models

     @belongsto Python::Markopy

     @extends Python::Markopy::BaseCLI

     """

     @abstractmethod

     def add_arguments(self):

         "Add command line arguements to the parser"

         super().add_arguments()

         self.parserparser.add_argument("input",                            help="Input model file. This model will be imported before starting operation.")

         self.parserparser.add_argument("-w", "--wordlist",                 help="Wordlist file path to export generation results to. Will be ignored for training mode")

         self.parserparser.add_argument("--min", default=6,                 help="Minimum length that is allowed during generation")

         self.parserparser.add_argument("--max", default=12,                help="Maximum length that is allowed during generation")

         self.parserparser.add_argument("-n", "--count",                    help="Number of lines to generate. Ignored in training mode.")


 class AbstractTrainingModelCLI(AbstractGenerationModelCLI, BaseCLI):

     """!

     @brief abstract class for training capable models

     @belongsto Python::Markopy

     @extends Python::Markopy::BaseCLI

     @extends Python::Markopy::AbstractGenerationModelCLI

     """

     @abstractmethod

     def add_arguments(self):

         "Add command line arguements to the parser"

         self.parserparser.add_argument("-o", "--output",                   help="Output model file. This model will be exported when done. Will be ignored for generation mode.")

         self.parserparser.add_argument("-d", "--dataset",                  help="Dataset file to read input from for training. Will be ignored for generation mode.")

         self.parserparser.add_argument("-s", "--seperator",                help="Seperator character to use with training data.(character between occurrence and value)")

         super().add_arguments()

Python.Markopy.AbstractGenerationModelCLI
abstract class for generation capable models
Definition: base.py:257

Python.Markopy.AbstractGenerationModelCLI.add_arguments
def add_arguments(self)
Definition: base.py:264

Python.Markopy.AbstractTrainingModelCLI
abstract class for training capable models
Definition: base.py:274

Python.Markopy.AbstractTrainingModelCLI.add_arguments
def add_arguments(self)
Definition: base.py:282

Python.Markopy.BaseCLI
Base CLI class to handle user interactions
Definition: base.py:16

Python.Markopy.BaseCLI.check_import_path
def check_import_path(str filename)
check import path for validity
Definition: base.py:169

Python.Markopy.BaseCLI.parse
def parse(self)
Definition: base.py:55

Python.Markopy.BaseCLI.check_corpus_path
def check_corpus_path(str filename)
check import path for validity
Definition: base.py:181

Python.Markopy.BaseCLI.init_post_arguments
def init_post_arguments(self)
Definition: base.py:62

Python.Markopy.BaseCLI.train
def train(self, str dataset, str seperator, str output, bool output_forced=False, bool bulk=False)
Train a model via CLI parameters.
Definition: base.py:94

Python.Markopy.BaseCLI.print_help
print_help
Definition: base.py:39

Python.Markopy.BaseCLI.args
args
Definition: base.py:75

Python.Markopy.BaseCLI.import_model
def import_model(self, str filename)
Import a model file.
Definition: base.py:77

Python.Markopy.BaseCLI.__init__
def __init__(self, bool add_help=True)
initialize base CLI
Definition: base.py:20

Python.Markopy.BaseCLI.add_arguments
def add_arguments(self)
Definition: base.py:43

Python.Markopy.BaseCLI.model
model
Definition: base.py:40

Python.Markopy.BaseCLI.parse_arguments
def parse_arguments(self)
Definition: base.py:73

Python.Markopy.BaseCLI.process
def process(self)
Process parameters for operation.
Definition: base.py:202

Python.Markopy.BaseCLI.help
def help(self)
Definition: base.py:51

Python.Markopy.BaseCLI.parser
parser
Definition: base.py:25

Python.Markopy.BaseCLI.check_export_path
def check_export_path(str filename)
check import path for validity
Definition: base.py:192

Python.Markopy.BaseCLI._generate
def _generate(self, str wordlist)
wrapper for generate function.
Definition: base.py:161

Python.Markopy.BaseCLI.generate
def generate(self, str wordlist, bool bulk=False)
Generate strings from the model.
Definition: base.py:145

Python.Markopy.BaseCLI.export
def export(self, str filename)
Export model to a file.
Definition: base.py:138

Python.Markopy.MarkovModel
Abstract representation of a markov model.
Definition: mm.py:13