src/emscripten-optimizer/parser.h - external/github.com/WebAssembly/binaryen - Git at Google

 /*
  * Copyright 2015 WebAssembly Community Group participants
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
  * You may obtain a copy of the License at
  *
  *     http://www.apache.org/licenses/LICENSE-2.0
  *
  * Unless required by applicable law or agreed to in writing, software
  * distributed under the License is distributed on an "AS IS" BASIS,
  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */

 // Pure parsing. Calls methods on a Builder (template argument) to actually construct the AST
 //
 // XXX All parsing methods assume they take ownership of the input string. This lets them reuse
 //     parts of it. You will segfault if the input string cannot be reused and written to.

 #ifndef wasm_parser_h
 #define wasm_parser_h

 #include <algorithm>
 #include <cstdio>
 #include <iostream>
 #include <limits>
 #include <vector>

 #include "istring.h"
 #include "support/safe_integer.h"

 namespace cashew {

 // common strings

 extern IString TOPLEVEL,
                DEFUN,
                BLOCK,
                STAT,
                ASSIGN,
                NAME,
                VAR,
                CONST,
                CONDITIONAL,
                BINARY,
                RETURN,
                IF,
                ELSE,
                WHILE,
                DO,
                FOR,
                SEQ,
                SUB,
                CALL,
                NUM,
                LABEL,
                BREAK,
                CONTINUE,
                SWITCH,
                STRING,
                INF,
                NaN,
                TEMP_RET0,
                GET_TEMP_RET0,
                LLVM_CTTZ_I32,
                UDIVMODDI4,
                UNARY_PREFIX,
                UNARY_POSTFIX,
                MATH_FROUND,
                INT64,
                INT64_CONST,
                SIMD_FLOAT32X4,
                SIMD_FLOAT64X2,
                SIMD_INT8X16,
                SIMD_INT16X8,
                SIMD_INT32X4,
                PLUS,
                MINUS,
                OR,
                AND,
                XOR,
                L_NOT,
                B_NOT,
                LT,
                GE,
                LE,
                GT,
                EQ,
                NE,
                DIV,
                MOD,
                MUL,
                RSHIFT,
                LSHIFT,
                TRSHIFT,
                TEMP_DOUBLE_PTR,
                HEAP8,
                HEAP16,
                HEAP32,
                HEAPF32,
                HEAPU8,
                HEAPU16,
                HEAPU32,
                HEAPF64,
                F0,
                EMPTY,
                FUNCTION,
                OPEN_PAREN,
                OPEN_BRACE,
                OPEN_CURLY,
                CLOSE_CURLY,
                COMMA,
                QUESTION,
                COLON,
                CASE,
                DEFAULT,
                DOT,
                PERIOD,
                NEW,
                ARRAY,
                OBJECT,
                THROW,
                SET;

 extern IStringSet keywords;

 extern const char *OPERATOR_INITS, *SEPARATORS;

 extern int MAX_OPERATOR_SIZE, LOWEST_PREC;

 struct OperatorClass {
   enum Type {
     Binary = 0,
     Prefix = 1,
     Postfix = 2,
     Tertiary = 3
   };

   IStringSet ops;
   bool rtl;
   Type type;

   OperatorClass(const char* o, bool r, Type t) : ops(o), rtl(r), type(t) {}

   static int getPrecedence(Type type, IString op);
   static bool getRtl(int prec);
 };

 extern std::vector<OperatorClass> operatorClasses;

 extern bool isIdentInit(char x);
 extern bool isIdentPart(char x);

 // parser

 template<class NodeRef, class Builder>
 class Parser {

   static bool isSpace(char x) { return x == 32 || x == 9 || x == 10 || x == 13; } /* space, tab, linefeed/newline, or return */
   static void skipSpace(char*& curr) {
     while (*curr) {
       if (isSpace(*curr)) {
         curr++;
         continue;
       }
       if (curr[0] == '/' && curr[1] == '/') {
         curr += 2;
         while (*curr && *curr != '\n') curr++;
         if (*curr) curr++;
         continue;
       }
       if (curr[0] == '/' && curr[1] == '*') {
         curr += 2;
         while (*curr && (curr[0] != '*' || curr[1] != '/')) curr++;
         curr += 2;
         continue;
       }
       return;
     }
   }

   static bool isDigit(char x) { return x >= '0' && x <= '9'; }

   static bool hasChar(const char* list, char x) { while (*list) if (*list++ == x) return true; return false; }

   // An atomic fragment of something. Stops at a natural boundary.
   enum FragType {
     KEYWORD = 0,
     OPERATOR = 1,
     IDENT = 2,
     STRING = 3, // without quotes
     INT = 4,
     DOUBLE = 5,
     SEPARATOR = 6
   };

   struct Frag {
 #ifndef _MSC_VER // MSVC does not allow unrestricted unions: http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2008/n2544.pdf
     union {
 #endif
       IString str;
       double num;
 #ifndef _MSC_VER
     };
 #endif
     int size;
     FragType type;

     bool isNumber() const {
       return type == INT || type == DOUBLE;
     }

     explicit Frag(char* src) {
       char *start = src;
       if (isIdentInit(*src)) {
         // read an identifier or a keyword
         src++;
         while (isIdentPart(*src)) {
           src++;
         }
         if (*src == 0) {
           str.set(start);
         } else {
           char temp = *src;
           *src = 0;
           str.set(start, false);
           *src = temp;
         }
         type = keywords.has(str) ? KEYWORD : IDENT;
       } else if (isDigit(*src) || (src[0] == '.' && isDigit(src[1]))) {
         if (src[0] == '0' && (src[1] == 'x' || src[1] == 'X')) {
           // Explicitly parse hex numbers of form "0x...", because strtod
           // supports hex number strings only in C++11, and Visual Studio 2013 does
           // not yet support that functionality.
           src += 2;
           num = 0;
           while (1) {
             if (*src >= '0' && *src <= '9') { num *= 16; num += *src - '0'; }
             else if (*src >= 'a' && *src <= 'f') { num *= 16; num += *src - 'a' + 10; }
             else if (*src >= 'A' && *src <= 'F') { num *= 16; num += *src - 'A' + 10; }
             else break;
             src++;
           }
         } else {
           num = strtod(start, &src);
         }
         // asm.js must have a '.' for double values. however, we also tolerate
         // uglify's tendency to emit without a '.' (and fix it later with a +).
         // for valid asm.js input, the '.' should be enough, and for uglify
         // in the emscripten optimizer pipeline, we use simple_ast where INT/DOUBLE
         // is quite the same at this point anyhow
         type = (std::find(start, src, '.') == src &&
                 (wasm::isSInteger32(num) || wasm::isUInteger32(num)))
                    ? INT
                    : DOUBLE;
         assert(src > start);
       } else if (hasChar(OPERATOR_INITS, *src)) {
         switch (*src) {
           case '!': str = src[1] == '=' ? NE : L_NOT; break;
           case '%': str = MOD; break;
           case '&': str = AND; break;
           case '*': str = MUL; break;
           case '+': str = PLUS; break;
           case ',': str = COMMA; break;
           case '-': str = MINUS; break;
           case '.': str = PERIOD; break;
           case '/': str = DIV; break;
           case ':': str = COLON; break;
           case '<': str = src[1] == '<' ? LSHIFT : (src[1] == '=' ? LE : LT); break;
           case '=': str = src[1] == '=' ? EQ : SET; break;
           case '>': str = src[1] == '>' ? (src[2] == '>' ? TRSHIFT : RSHIFT) : (src[1] == '=' ? GE : GT); break;
           case '?': str = QUESTION; break;
           case '^': str = XOR; break;
           case '|': str = OR; break;
           case '~': str = B_NOT; break;
           default: abort();
         }
         size = strlen(str.str);
 #ifndef NDEBUG
         char temp = start[size];
         start[size] = 0;
         assert(strcmp(str.str, start) == 0);
         start[size] = temp;
 #endif
         type = OPERATOR;
         return;
       } else if (hasChar(SEPARATORS, *src)) {
         type = SEPARATOR;
         char temp = src[1];
         src[1] = 0;
         str.set(src, false);
         src[1] = temp;
         src++;
       } else if (*src == '"' || *src == '\'') {
         char *end = strchr(src+1, *src);
         *end = 0;
         str.set(src+1);
         src = end+1;
         type = STRING;
       } else {
         dump("frag parsing", src);
         abort();
       }
       size = src - start;
     }
   };

   struct ExpressionElement {
     bool isNode;
 #ifndef _MSC_VER // MSVC does not allow unrestricted unions: http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2008/n2544.pdf
     union {
 #endif
       NodeRef node;
       IString op;
 #ifndef _MSC_VER
     };
 #endif
     ExpressionElement(NodeRef n) : isNode(true), node(n) {}
     ExpressionElement(IString o) : isNode(false), op(o) {}

     NodeRef getNode() {
       assert(isNode);
       return node;
     }
     IString getOp() {
       assert(!isNode);
       return op;
     }
   };

   // This is a list of the current stack of node-operator-node-operator-etc.
   // this works by each parseExpression call appending to the vector; then recursing out, and the toplevel sorts it all
   typedef std::vector<ExpressionElement> ExpressionParts;
   std::vector<ExpressionParts> expressionPartsStack;

   // Parses an element in a list of such elements, e.g. list of statements in a block, or list of parameters in a call
   NodeRef parseElement(char*& src, const char* seps=";") {
     //dump("parseElement", src);
     skipSpace(src);
     Frag frag(src);
     src += frag.size;
     switch (frag.type) {
       case KEYWORD: {
         return parseAfterKeyword(frag, src, seps);
       }
       case IDENT: {
         return parseAfterIdent(frag, src, seps);
       }
       case STRING:
       case INT:
       case DOUBLE: {
         return parseExpression(parseFrag(frag), src, seps);
       }
       case SEPARATOR: {
         if (frag.str == OPEN_PAREN) return parseExpression(parseAfterParen(src), src, seps);
         if (frag.str == OPEN_BRACE) return parseExpression(parseAfterBrace(src), src, seps);
         if (frag.str == OPEN_CURLY) return parseExpression(parseAfterCurly(src), src, seps);
         abort();
       }
       case OPERATOR: {
         return parseExpression(frag.str, src, seps);
       }
       default: /* dump("parseElement", src); printf("bad frag type: %d\n", frag.type); */ abort();
     }
     return nullptr;
   }

   NodeRef parseFrag(Frag& frag) {
     switch (frag.type) {
       case IDENT:  return Builder::makeName(frag.str);
       case STRING: return Builder::makeString(frag.str);
       case INT:    return Builder::makeInt(uint32_t(frag.num));
       case DOUBLE: return Builder::makeDouble(frag.num);
       default: abort();
     }
     return nullptr;
   }

   NodeRef parseAfterKeyword(Frag& frag, char*& src, const char* seps) {
     skipSpace(src);
     if (frag.str == FUNCTION) return parseFunction(src, seps);
     else if (frag.str == VAR) return parseVar(src, seps, false);
     else if (frag.str == CONST) return parseVar(src, seps, true);
     else if (frag.str == RETURN) return parseReturn(src, seps);
     else if (frag.str == IF) return parseIf(src, seps);
     else if (frag.str == DO) return parseDo(src, seps);
     else if (frag.str == WHILE) return parseWhile(src, seps);
     else if (frag.str == BREAK) return parseBreak(src, seps);
     else if (frag.str == CONTINUE) return parseContinue(src, seps);
     else if (frag.str == SWITCH) return parseSwitch(src, seps);
     else if (frag.str == NEW) return parseNew(src, seps);
     else if (frag.str == FOR) return parseFor(src, seps);
     dump(frag.str.str, src);
     abort();
     return nullptr;
   }

   NodeRef parseFunction(char*& src, const char* seps) {
     Frag name(src);
     if (name.type == IDENT) {
       src += name.size;
     } else {
       assert(name.type == SEPARATOR && name.str[0] == '(');
       name.str = IString();
     }
     NodeRef ret = Builder::makeFunction(name.str);
     skipSpace(src);
     assert(*src == '(');
     src++;
     while (1) {
       skipSpace(src);
       if (*src == ')') break;
       Frag arg(src);
       assert(arg.type == IDENT);
       src += arg.size;
       Builder::appendArgumentToFunction(ret, arg.str);
       skipSpace(src);
       if (*src == ')') break;
       if (*src == ',') {
         src++;
         continue;
       }
       abort();
     }
     src++;
     Builder::setBlockContent(ret, parseBracketedBlock(src));
     // TODO: parse expression?
     return ret;
   }

   NodeRef parseVar(char*& src, const char* seps, bool is_const) {
     NodeRef ret = Builder::makeVar(is_const);
     while (1) {
       skipSpace(src);
       if (*src == ';') break;
       Frag name(src);
       assert(name.type == IDENT);
       NodeRef value;
       src += name.size;
       skipSpace(src);
       if (*src == '=') {
         src++;
         skipSpace(src);
         value = parseElement(src, ";,");
       }
       Builder::appendToVar(ret, name.str, value);
       skipSpace(src);
       if (*src == ';') break;
       if (*src == ',') {
         src++;
         continue;
       }
       abort();
     }
     src++;
     return ret;
   }

   NodeRef parseReturn(char*& src, const char* seps) {
     skipSpace(src);
     NodeRef value = !hasChar(seps, *src) ? parseElement(src, seps) : nullptr;
     skipSpace(src);
     assert(hasChar(seps, *src));
     if (*src == ';') src++;
     return Builder::makeReturn(value);
   }

   NodeRef parseIf(char*& src, const char* seps) {
     NodeRef condition = parseParenned(src);
     NodeRef ifTrue = parseMaybeBracketed(src, seps);
     skipSpace(src);
     NodeRef ifFalse;
     if (!hasChar(seps, *src)) {
       Frag next(src);
       if (next.type == KEYWORD && next.str == ELSE) {
         src += next.size;
         ifFalse = parseMaybeBracketed(src, seps);
       }
     }
     return Builder::makeIf(condition, ifTrue, ifFalse);
   }

   NodeRef parseDo(char*& src, const char* seps) {
     NodeRef body = parseMaybeBracketed(src, seps);
     skipSpace(src);
     Frag next(src);
     assert(next.type == KEYWORD && next.str == WHILE);
     src += next.size;
     NodeRef condition = parseParenned(src);
     return Builder::makeDo(body, condition);
   }

   NodeRef parseWhile(char*& src, const char* seps) {
     NodeRef condition = parseParenned(src);
     NodeRef body = parseMaybeBracketed(src, seps);
     return Builder::makeWhile(condition, body);
   }

   NodeRef parseFor(char*& src, const char* seps) {
     skipSpace(src);
     assert(*src == '(');
     src++;
     NodeRef init = parseElement(src, ";");
     skipSpace(src);
     assert(*src == ';');
     src++;
     NodeRef condition = parseElement(src, ";");
     skipSpace(src);
     assert(*src == ';');
     src++;
     NodeRef inc = parseElement(src, ")");
     skipSpace(src);
     assert(*src == ')');
     src++;
     NodeRef body = parseMaybeBracketed(src, seps);
     return Builder::makeFor(init, condition, inc, body);
   }

   NodeRef parseBreak(char*& src, const char* seps) {
     skipSpace(src);
     Frag next(src);
     if (next.type == IDENT) src += next.size;
     return Builder::makeBreak(next.type == IDENT ? next.str : IString());
   }

   NodeRef parseContinue(char*& src, const char* seps) {
     skipSpace(src);
     Frag next(src);
     if (next.type == IDENT) src += next.size;
     return Builder::makeContinue(next.type == IDENT ? next.str : IString());
   }

   NodeRef parseSwitch(char*& src, const char* seps) {
     NodeRef ret = Builder::makeSwitch(parseParenned(src));
     skipSpace(src);
     assert(*src == '{');
     src++;
     while (1) {
       // find all cases and possibly a default
       skipSpace(src);
       if (*src == '}') break;
       Frag next(src);
       if (next.type == KEYWORD) {
         if (next.str == CASE) {
           src += next.size;
           skipSpace(src);
           NodeRef arg;
           Frag value(src);
           if (value.isNumber()) {
             arg = parseFrag(value);
             src += value.size;
           } else if (value.type == OPERATOR) {
             // negative number
             assert(value.str == MINUS);
             src += value.size;
             skipSpace(src);
             Frag value2(src);
             assert(value2.isNumber());
             arg = Builder::makePrefix(MINUS, parseFrag(value2));
             src += value2.size;
           } else {
             // identifier and function call
             assert(value.type == IDENT);
             src += value.size;
             skipSpace(src);
             arg = parseCall(parseFrag(value), src);
           }
           Builder::appendCaseToSwitch(ret, arg);
           skipSpace(src);
           assert(*src == ':');
           src++;
           continue;
         } else if (next.str == DEFAULT) {
           src += next.size;
           Builder::appendDefaultToSwitch(ret);
           skipSpace(src);
           assert(*src == ':');
           src++;
           continue;
         }
         // otherwise, may be some keyword that happens to start a block (e.g. case 1: _return_ 5)
       }
       // not case X: or default: or }, so must be some code
       skipSpace(src);
       bool explicitBlock = *src == '{';
       NodeRef subBlock = explicitBlock ? parseBracketedBlock(src) : parseBlock(src, ";}", CASE, DEFAULT);
       Builder::appendCodeToSwitch(ret, subBlock, explicitBlock);
     }
     skipSpace(src);
     assert(*src == '}');
     src++;
     return ret;
   }

   NodeRef parseNew(char*& src, const char* seps) {
     return Builder::makeNew(parseElement(src, seps));
   }

   NodeRef parseAfterIdent(Frag& frag, char*& src, const char* seps) {
     skipSpace(src);
     if (*src == '(') return parseExpression(parseCall(parseFrag(frag), src), src, seps);
     if (*src == '[') return parseExpression(parseIndexing(parseFrag(frag), src), src, seps);
     if (*src == ':' && expressionPartsStack.back().size() == 0) {
       src++;
       skipSpace(src);
       NodeRef inner;
       if (*src == '{') { // context lets us know this is not an object, but a block
         inner = parseBracketedBlock(src);
       } else {
         inner = parseElement(src, seps);
       }
       return Builder::makeLabel(frag.str, inner);
     }
     if (*src == '.') return parseExpression(parseDotting(parseFrag(frag), src), src, seps);
     return parseExpression(parseFrag(frag), src, seps);
   }

   NodeRef parseCall(NodeRef target, char*& src) {
     expressionPartsStack.resize(expressionPartsStack.size()+1);
     assert(*src == '(');
     src++;
     NodeRef ret = Builder::makeCall(target);
     while (1) {
       skipSpace(src);
       if (*src == ')') break;
       Builder::appendToCall(ret, parseElement(src, ",)"));
       skipSpace(src);
       if (*src == ')') break;
       if (*src == ',') {
         src++;
         continue;
       }
       abort();
     }
     src++;
     assert(expressionPartsStack.back().size() == 0);
     expressionPartsStack.pop_back();
     return ret;
   }

   NodeRef parseIndexing(NodeRef target, char*& src) {
     expressionPartsStack.resize(expressionPartsStack.size()+1);
     assert(*src == '[');
     src++;
     NodeRef ret = Builder::makeIndexing(target, parseElement(src, "]"));
     skipSpace(src);
     assert(*src == ']');
     src++;
     assert(expressionPartsStack.back().size() == 0);
     expressionPartsStack.pop_back();
     return ret;
   }

   NodeRef parseDotting(NodeRef target, char*& src) {
     assert(*src == '.');
     src++;
     Frag key(src);
     assert(key.type == IDENT);
     src += key.size;
     return Builder::makeDot(target, key.str);
   }

   NodeRef parseAfterParen(char*& src) {
     expressionPartsStack.resize(expressionPartsStack.size()+1);
     skipSpace(src);
     NodeRef ret = parseElement(src, ")");
     skipSpace(src);
     assert(*src == ')');
     src++;
     assert(expressionPartsStack.back().size() == 0);
     expressionPartsStack.pop_back();
     return ret;
   }

   NodeRef parseAfterBrace(char*& src) {
     expressionPartsStack.resize(expressionPartsStack.size()+1);
     NodeRef ret = Builder::makeArray();
     while (1) {
       skipSpace(src);
       assert(*src);
       if (*src == ']') break;
       NodeRef element = parseElement(src, ",]");
       Builder::appendToArray(ret, element);
       skipSpace(src);
       if (*src == ']') break;
       if (*src == ',') {
         src++;
         continue;
       }
       abort();
     }
     src++;
     return ret;
   }

   NodeRef parseAfterCurly(char*& src) {
     expressionPartsStack.resize(expressionPartsStack.size()+1);
     NodeRef ret = Builder::makeObject();
     while (1) {
       skipSpace(src);
       assert(*src);
       if (*src == '}') break;
       Frag key(src);
       assert(key.type == IDENT || key.type == STRING);
       src += key.size;
       skipSpace(src);
       assert(*src == ':');
       src++;
       NodeRef value = parseElement(src, ",}");
       Builder::appendToObject(ret, key.str, value);
       skipSpace(src);
       if (*src == '}') break;
       if (*src == ',') {
         src++;
         continue;
       }
       abort();
     }
     src++;
     return ret;
   }

   void dumpParts(ExpressionParts& parts, int i) {
     printf("expressionparts: %d (at %d)\n", parts.size(), i);
     printf("| ");
     for (int i = 0; i < parts.size(); i++) {
       if (parts[i].isNode) {
         parts[i].getNode()->stringify(std::cout);
         printf("    ");
       } else {
         printf("    _%s_    ", parts[i].getOp().str);
       }
     }
     printf("|\n");
   }

   NodeRef makeBinary(NodeRef left, IString op, NodeRef right) {
     if (op == PERIOD) {
       return Builder::makeDot(left, right);
     } else {
       return Builder::makeBinary(left, op ,right);
     }
   }

   NodeRef parseExpression(ExpressionElement initial, char*&src, const char* seps) {
     //dump("parseExpression", src);
     ExpressionParts& parts = expressionPartsStack.back();
     skipSpace(src);
     if (*src == 0 || hasChar(seps, *src)) {
       if (parts.size() > 0) {
         parts.push_back(initial); // cherry on top of the cake
       }
       return initial.getNode();
     }
     bool top = parts.size() == 0;
     if (initial.isNode) {
       Frag next(src);
       if (next.type == OPERATOR) {
         parts.push_back(initial);
         src += next.size;
         parts.push_back(next.str);
       } else {
         if (*src == '(') {
           initial = parseCall(initial.getNode(), src);
         } else if (*src == '[') {
           initial = parseIndexing(initial.getNode(), src);
         } else {
           dump("bad parseExpression state", src);
           abort();
         }
         return parseExpression(initial, src, seps);
       }
     } else {
       parts.push_back(initial);
     }
     NodeRef last = parseElement(src, seps);
     if (!top) return last;
     {
       ExpressionParts& parts = expressionPartsStack.back(); // |parts| may have been invalidated by that call
       // we are the toplevel. sort it all out
       // collapse right to left, highest priority first
       //dumpParts(parts, 0);
       for (auto& ops : operatorClasses) {
         if (ops.rtl) {
           // right to left
           for (int i = parts.size()-1; i >= 0; i--) {
             if (parts[i].isNode) continue;
             IString op = parts[i].getOp();
             if (!ops.ops.has(op)) continue;
             if (ops.type == OperatorClass::Binary && i > 0 && i < (int)parts.size()-1) {
               parts[i] = makeBinary(parts[i-1].getNode(), op, parts[i+1].getNode());
               parts.erase(parts.begin() + i + 1);
               parts.erase(parts.begin() + i - 1);
             } else if (ops.type == OperatorClass::Prefix && i < (int)parts.size()-1) {
               if (i > 0 && parts[i-1].isNode) continue; // cannot apply prefix operator if it would join two nodes
               parts[i] = Builder::makePrefix(op, parts[i+1].getNode());
               parts.erase(parts.begin() + i + 1);
             } else if (ops.type == OperatorClass::Tertiary) {
               // we must be at  X ? Y : Z
               //                      ^
               //dumpParts(parts, i);
               if (op != COLON) continue;
               assert(i < (int)parts.size()-1 && i >= 3);
               if (parts[i-2].getOp() != QUESTION) continue; // e.g. x ? y ? 1 : 0 : 2
               parts[i-3] = Builder::makeConditional(parts[i-3].getNode(), parts[i-1].getNode(), parts[i+1].getNode());
               parts.erase(parts.begin() + i - 2, parts.begin() + i + 2);
               i = parts.size(); // basically a reset, due to things like x ? y ? 1 : 0 : 2
             } // TODO: postfix
           }
         } else {
           // left to right
           for (int i = 0; i < (int)parts.size(); i++) {
             if (parts[i].isNode) continue;
             IString op = parts[i].getOp();
             if (!ops.ops.has(op)) continue;
             if (ops.type == OperatorClass::Binary && i > 0 && i < (int)parts.size()-1) {
               parts[i] = makeBinary(parts[i-1].getNode(), op, parts[i+1].getNode());
               parts.erase(parts.begin() + i + 1);
               parts.erase(parts.begin() + i - 1);
               i--;
             } else if (ops.type == OperatorClass::Prefix && i < (int)parts.size()-1) {
               if (i > 0 && parts[i-1].isNode) continue; // cannot apply prefix operator if it would join two nodes
               parts[i] = Builder::makePrefix(op, parts[i+1].getNode());
               parts.erase(parts.begin() + i + 1);
               i = std::max(i-2, 0); // allow a previous prefix operator to cascade
             } // TODO: tertiary, postfix
           }
         }
       }
       assert(parts.size() == 1);
       NodeRef ret = parts[0].getNode();
       parts.clear();
       return ret;
     }
   }

   // Parses a block of code (e.g. a bunch of statements inside {,}, or the top level of o file)
   NodeRef parseBlock(char*& src, const char* seps=";", IString keywordSep1=IString(), IString keywordSep2=IString()) {
     NodeRef block = Builder::makeBlock();
     //dump("parseBlock", src);
     while (1) {
       skipSpace(src);
       if (*src == 0) break;
       if (*src == ';') {
         src++; // skip a statement in this block
         continue;
       }
       if (hasChar(seps, *src)) break;
       if (!!keywordSep1) {
         Frag next(src);
         if (next.type == KEYWORD && next.str == keywordSep1) break;
       }
       if (!!keywordSep2) {
         Frag next(src);
         if (next.type == KEYWORD && next.str == keywordSep2) break;
       }
       NodeRef element = parseElementOrStatement(src, seps);
       Builder::appendToBlock(block, element);
     }
     return block;
   }

   NodeRef parseBracketedBlock(char*& src) {
     skipSpace(src);
     assert(*src == '{');
     src++;
     NodeRef block = parseBlock(src, ";}"); // the two are not symmetrical, ; is just internally separating, } is the final one - parseBlock knows all this
     assert(*src == '}');
     src++;
     return block;
   }

   NodeRef parseElementOrStatement(char*& src, const char *seps) {
     skipSpace(src);
     if (*src == ';') {
       src++;
       return Builder::makeBlock(); // we don't need the brackets here, but oh well
     }
     if (*src == '{') { // detect a trivial {} in a statement context
       char *before = src;
       src++;
       skipSpace(src);
       if (*src == '}') {
         src++;
         return Builder::makeBlock(); // we don't need the brackets here, but oh well
       }
       src = before;
     }
     NodeRef ret = parseElement(src, seps);
     skipSpace(src);
     if (*src == ';') {
       ret = Builder::makeStatement(ret);
       src++;
     }
     return ret;
   }

   NodeRef parseMaybeBracketed(char*& src, const char *seps) {
     skipSpace(src);
     return *src == '{' ? parseBracketedBlock(src) : parseElementOrStatement(src, seps);
   }

   NodeRef parseParenned(char*& src) {
     skipSpace(src);
     assert(*src == '(');
     src++;
     NodeRef ret = parseElement(src, ")");
     skipSpace(src);
     assert(*src == ')');
     src++;
     return ret;
   }

   // Debugging

   char *allSource;
   int allSize;

   static void dump(const char *where, char* curr) {
     /*
     printf("%s:\n=============\n", where);
     for (int i = 0; i < allSize; i++) printf("%c", allSource[i] ? allSource[i] : '?');
     printf("\n");
     for (int i = 0; i < (curr - allSource); i++) printf(" ");
     printf("^\n=============\n");
     */
     fprintf(stderr, "%s:\n==========\n", where);
     int newlinesLeft = 2;
     int charsLeft = 200;
     while (*curr) {
       if (*curr == '\n') {
         newlinesLeft--;
         if (newlinesLeft == 0) break;
       }
       charsLeft--;
       if (charsLeft == 0) break;
       fprintf(stderr, "%c", *curr++);
     }
     fprintf(stderr, "\n\n");
   }

 public:

   Parser() : allSource(nullptr), allSize(0) {
     expressionPartsStack.resize(1);
   }

   // Highest-level parsing, as of a JavaScript script file.
   NodeRef parseToplevel(char* src) {
     allSource = src;
     allSize = strlen(src);
     NodeRef toplevel = Builder::makeToplevel();
     Builder::setBlockContent(toplevel, parseBlock(src));
     return toplevel;
   }
 };

 } // namespace cashew

 #endif // wasm_parser_h