Merge pull request #180 from julienmalard/master

Added relative imports
6 years ago · 2fd0087878
--- a/lark/load_grammar.py
+++ b/lark/load_grammar.py
@@ -1,6 +1,7 @@
 "Parses and creates Grammar objects"

 import os.path
 import sys
 from itertools import chain
 import re
 from ast import literal_eval
@@ -75,6 +76,7 @@ TERMINALS = {
    '_RBRA': r'\]',
    'OP': '[+*][?]?|[?](?![a-z])',
    '_COLON': ':',
    '_COMMA': ',',
    '_OR': r'\|',
    '_DOT': r'\.',
    'TILDE': '~',
@@ -136,12 +138,19 @@ RULES = {
    'statement': ['ignore', 'import', 'declare'],
    'ignore': ['_IGNORE expansions _NL'],
    'declare': ['_DECLARE _declare_args _NL'],
    'import': ['_IMPORT import_args _NL',
               '_IMPORT import_args _TO TERMINAL _NL'],
    'import_args': ['_import_args'],
    'import': ['_IMPORT _import_path _NL',
               '_IMPORT _import_path _LPAR list_name _RPAR _NL',
               '_IMPORT _import_path _TO TERMINAL _NL'],

    '_import_path': ['import_common', 'import_rel'],
    'import_common': ['_import_args'],
    'import_rel': ['_DOT _import_args'],
    '_import_args': ['name', '_import_args _DOT name'],
    '_declare_args': ['name', '_declare_args name'],

    'list_name': ['_list_name'],
    '_list_name': ['name', '_list_name _COMMA name'],

    '_declare_args': ['name', '_declare_args name'],
    'literal': ['REGEXP', 'STRING'],
 }

@@ -497,13 +506,25 @@ class Grammar:


 _imported_grammars = {}
 def import_grammar(grammar_path):
 def import_grammar(grammar_path, base_path=None):
    if grammar_path not in _imported_grammars:
        for import_path in IMPORT_PATHS:
            with open(os.path.join(import_path, grammar_path)) as f:
                text = f.read()
            grammar = load_grammar(text, grammar_path)
            _imported_grammars[grammar_path] = grammar
        if base_path is None:
            import_paths = IMPORT_PATHS
        else:
            import_paths = [base_path] + IMPORT_PATHS
        found = False
        for import_path in import_paths:
            try:
                with open(os.path.join(import_path, grammar_path)) as f:
                    text = f.read()
                grammar = load_grammar(text, grammar_path)
                _imported_grammars[grammar_path] = grammar
                found = True
                break
            except FileNotFoundError:
                pass
        if not found:
            raise FileNotFoundError(grammar_path)

    return _imported_grammars[grammar_path]

@@ -572,13 +593,14 @@ class GrammarLoader:

        self.canonize_tree = CanonizeTree()

    def load_grammar(self, grammar_text, name='<?>'):
    def load_grammar(self, grammar_text, grammar_name='<?>'):
        "Parse grammar_text, verify, and create Grammar object. Display nice messages on error."

        try:
            tree = self.canonize_tree.transform( self.parser.parse(grammar_text+'\n') )
        except UnexpectedCharacters as e:
            raise GrammarError("Unexpected input %r at line %d column %d in %s" % (e.context, e.line, e.column, name))
            raise GrammarError("Unexpected input %r at line %d column %d in %s" %
                               (e.context, e.line, e.column, grammar_name))
        except UnexpectedToken as e:
            context = e.get_context(grammar_text)
            error = e.match_examples(self.parser.parse, {
@@ -619,12 +641,31 @@ class GrammarLoader:
                ignore.append(t)
            elif stmt.data == 'import':
                dotted_path = stmt.children[0].children
                name = stmt.children[1] if len(stmt.children)>1 else dotted_path[-1]
                grammar_path = os.path.join(*dotted_path[:-1]) + '.lark'
                g = import_grammar(grammar_path)
                token_options = dict(g.token_defs)[dotted_path[-1]]
                assert isinstance(token_options, tuple) and len(token_options)==2
                token_defs.append([name.value, token_options])

                if len(stmt.children) > 1 and hasattr(stmt.children[1], 'children'):  # Multi import
                    names = stmt.children[1].children
                    aliases = names  # Can't have aliased multi import, so all aliases will be the same as names
                    grammar_path = os.path.join(*dotted_path) + '.lark'
                else:  # Single import
                    names = [dotted_path[-1]]  # Get name from dotted path
                    aliases = [stmt.children[1] if len(stmt.children) > 1 else dotted_path[-1]]  # Aliases if exist
                    grammar_path = os.path.join(*dotted_path[:-1]) + '.lark'  # Exclude name from grammar path

                if stmt.children[0].data == 'import_common':  # Regular import
                    g = import_grammar(grammar_path)
                else:  # Relative import
                    if grammar_name == '<string>':  # Import relative to script file path if grammar is coded in script
                        base_file = os.path.abspath(sys.modules['__main__'].__file__)
                    else:
                        base_file = grammar_name  # Import relative to grammar file path if external grammar file
                    base_path = os.path.split(base_file)[0]
                    g = import_grammar(grammar_path, base_path=base_path)

                for name, alias in zip(names, aliases):
                    token_options = dict(g.token_defs)[name]
                    assert isinstance(token_options, tuple) and len(token_options)==2
                    token_defs.append([alias.value, token_options])

            elif stmt.data == 'declare':
                for t in stmt.children:
                    token_defs.append([t.value, (None, None)])
--- a/tests/grammars/test.lark
+++ b/tests/grammars/test.lark
@@ -0,0 +1,3 @@
 %import common.NUMBER
 %import common.WORD
 %import common.WS
--- a/tests/test_parser.py
+++ b/tests/test_parser.py
@@ -936,6 +936,47 @@ def _make_parser_test(LEXER, PARSER):
            x = l.parse('12 elephants')
            self.assertEqual(x.children, ['12', 'elephants'])


        def test_relative_import(self):
            grammar = """
            start: NUMBER WORD

            %import .grammars.test.NUMBER
            %import common.WORD
            %import common.WS
            %ignore WS

            """
            l = _Lark(grammar)
            x = l.parse('12 lions')
            self.assertEqual(x.children, ['12', 'lions'])

        def test_multi_import(self):
            grammar = """
            start: NUMBER WORD

            %import common (NUMBER, WORD, WS)
            %ignore WS

            """
            l = _Lark(grammar)
            x = l.parse('12 toucans')
            self.assertEqual(x.children, ['12', 'toucans'])


        def test_relative_multi_import(self):
            grammar = """
           start: NUMBER WORD

           %import .grammars.test (NUMBER, WORD, WS)
           %ignore WS

           """
            l = _Lark(grammar)
            x = l.parse('12 capybaras')
            self.assertEqual(x.children, ['12', 'capybaras'])


        @unittest.skipIf(PARSER != 'earley', "Currently only Earley supports priority in rules")
        def test_earley_prioritization(self):
            "Tests effect of priority on result"