LWTools: lwcc/lex.c annotate

author	William Astle <lost@l-w.ca>
date	Thu, 12 Sep 2013 22:06:26 -0600
parents
children	83fcc1ed6ad6

rev	line source
295 4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	1 /*
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	2 lwcc/lex.c
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	3
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	4 Copyright © 2013 William Astle
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	5
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	6 This file is part of LWTOOLS.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	7
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	8 LWTOOLS is free software: you can redistribute it and/or modify it under the
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	9 terms of the GNU General Public License as published by the Free Software
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	10 Foundation, either version 3 of the License, or (at your option) any later
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	11 version.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	12
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	13 This program is distributed in the hope that it will be useful, but WITHOUT
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	16 more details.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	17
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	18 You should have received a copy of the GNU General Public License along with
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	19 this program. If not, see <http://www.gnu.org/licenses/>.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	20 */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	21
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	22 #include <ctype.h>
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	23 #include <stdio.h>
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	24
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	25 #include <lw_alloc.h>
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	26
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	27 #include "cpp.h"
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	28 #include "strbuf.h"
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	29 #include "token.h"
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	30
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	31 /* fetch a raw input byte from the current file. Will return CPP_EOF if
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	32 EOF is encountered and CPP_EOL if an end of line sequence is encountered.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	33 End of line is defined as either CR, CRLF, LF, or LFCR. CPP_EOL is
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	34 returned on the first CR or LF encountered. The complementary CR or LF
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	35 is munched, if present, when the next character is read. This always
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	36 operates on file_stack.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	37
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	38 This function also accounts for line numbers in input files and also
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	39 character columns.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	40 */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	41 static int fetch_byte_ll(struct preproc_info *pp)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	42 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	43 int c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	44
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	45 if (pp -> eolstate != 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	46 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	47 pp -> lineno++;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	48 pp -> column = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	49 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	50 c = getc(pp -> fp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	51 pp -> column++;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	52 if (pp -> eolstate == 1)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	53 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	54 // just saw CR, munch LF
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	55 if (c == 10)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	56 c = getc(pp -> fp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	57 pp -> eolstate = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	58 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	59 else if (pp -> eolstate == 2)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	60 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	61 // just saw LF, much CR
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	62 if (c == 13)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	63 c = getc(pp -> fp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	64 pp -> eolstate = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	65 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	66
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	67 if (c == 10)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	68 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	69 // we have LF - end of line, flag to munch CR
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	70 pp -> eolstate = 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	71 c = CPP_EOL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	72 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	73 else if (c == 13)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	74 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	75 // we have CR - end of line, flag to munch LF
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	76 pp -> eolstate = 1;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	77 c = CPP_EOL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	78 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	79 else if (c == EOF)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	80 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	81 c = CPP_EOF;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	82 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	83 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	84 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	85
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	86 /* This function takes a sequence of bytes from the _ll function above
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	87 and does trigraph interpretation on it, but only if the global
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	88 trigraphs is nonzero. */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	89 static int fetch_byte_tg(struct preproc_info *pp)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	90 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	91 int c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	92
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	93 if (!pp -> trigraphs)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	94 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	95 c = fetch_byte_ll(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	96 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	97 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	98 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	99 /* we have to do the trigraph shit here */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	100 if (pp -> ra != CPP_NOUNG)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	101 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	102 if (pp -> qseen > 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	103 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	104 c = '?';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	105 pp -> qseen -= 1;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	106 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	107 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	108 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	109 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	110 c = pp -> ra;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	111 pp -> ra = CPP_NOUNG;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	112 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	113 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	114 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	115
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	116 c = fetch_byte_ll(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	117 while (c == '?')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	118 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	119 pp -> qseen++;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	120 c = fetch_byte_ll(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	121 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	122
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	123 if (pp -> qseen >= 2)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	124 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	125 // we have a trigraph
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	126 switch (c)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	127 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	128 case '=':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	129 c = '#';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	130 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	131 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	132
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	133 case '/':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	134 c = '\\';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	135 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	136 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	137
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	138 case '\'':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	139 c = '^';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	140 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	141 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	142
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	143 case '(':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	144 c = '[';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	145 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	146 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	147
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	148 case ')':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	149 c = ']';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	150 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	151 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	152
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	153 case '!':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	154 c = '\|';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	155 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	156 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	157
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	158 case '<':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	159 c = '{';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	160 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	161 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	162
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	163 case '>':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	164 c = '}';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	165 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	166 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	167
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	168 case '-':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	169 c = '~';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	170 pp -> qseen -= 2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	171 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	172 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	173 if (pp -> qseen > 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	174 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	175 pp -> ra = c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	176 c = '?';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	177 pp -> qseen--;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	178 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	179 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	180 else if (pp -> qseen > 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	181 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	182 pp -> ra = c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	183 c = '?';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	184 pp -> qseen--;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	185 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	186 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	187 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	188 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	189
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	190 /* This function puts a byte back onto the front of the input stream used
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	191 by fetch_byte(). Theoretically, an unlimited number of characters can
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	192 be unfetched. Line and column counting may be incorrect if unfetched
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	193 characters cross a token boundary. */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	194 static void preproc_lex_unfetch_byte(struct preproc_info *pp, int c)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	195 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	196 if (pp -> ungetbufl >= pp -> ungetbufs)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	197 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	198 pp -> ungetbufs += 100;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	199 pp -> ungetbuf = lw_realloc(pp -> ungetbuf, pp -> ungetbufs);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	200 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	201 pp -> ungetbuf[pp -> ungetbufl++] = c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	202 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	203
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	204 /* This function retrieves a byte from the input stream. It performs
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	205 backslash-newline splicing on the returned bytes. Any character
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	206 retrieved from the unfetch buffer is presumed to have already passed
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	207 the backslash-newline filter. */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	208 static int fetch_byte(struct preproc_info *pp)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	209 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	210 int c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	211
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	212 if (pp -> ungetbufl > 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	213 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	214 pp -> ungetbufl--;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	215 c = pp -> ungetbuf[pp -> ungetbufl];
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	216 if (pp -> ungetbufl == 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	217 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	218 lw_free(pp -> ungetbuf);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	219 pp -> ungetbuf = NULL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	220 pp -> ungetbufs = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	221 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	222 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	223 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	224
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	225 again:
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	226 if (pp -> unget != CPP_NOUNG)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	227 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	228 c = pp -> unget;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	229 pp -> unget = CPP_NOUNG;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	230 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	231 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	232 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	233 c = fetch_byte_tg(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	234 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	235 if (c == '\\')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	236 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	237 int c2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	238 c2 = fetch_byte_tg(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	239 if (c2 == CPP_EOL)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	240 goto again;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	241 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	242 pp -> unget = c2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	243 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	244 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	245 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	246
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	247
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	248
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	249 /*
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	250 Lex a token off the current input file.
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	251
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	252 Returned tokens are as follows:
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	253
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	254 * all words starting with [a-zA-Z_] are returned as TOK_IDENT
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	255 * numbers are returned as their appropriate type
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	256 * all whitespace in a sequence, including comments, is returned as
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	257 a single instance of TOK_WSPACE
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	258 * TOK_EOL is returned in the case of the end of a line
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	259 * TOK_EOF is returned when the end of the file is reached
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	260 * If no TOK_EOL appears before TOK_EOF, a TOK_EOL will be synthesised
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	261 * Any symbolic operator, etc., recognized by C will be returned as such
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	262 a token
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	263 * TOK_HASH will be returned for a #
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	264 * trigraphs will be interpreted
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	265 * backslash-newline will be interpreted
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	266 * any instance of CR, LF, CRLF, or LFCR will be interpreted as TOK_EOL
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	267 */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	268
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	269
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	270 static int preproc_lex_fetch_byte(struct preproc_info *pp)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	271 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	272 int c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	273 c = fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	274 if (c == CPP_EOF && pp -> eolseen == 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	275 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	276 preproc_throw_warning(pp, "No newline at end of file");
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	277 pp -> eolseen = 1;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	278 return CPP_EOL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	279 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	280
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	281 if (c == CPP_EOL)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	282 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	283 pp -> eolseen = 1;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	284 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	285 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	286
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	287 pp -> eolseen = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	288
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	289 /* convert comments to a single space here */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	290 if (c == '/')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	291 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	292 int c2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	293 c2 = fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	294 if (c2 == '/')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	295 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	296 /* single line comment */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	297 c = ' ';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	298 for (;;)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	299 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	300 c2 = fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	301 if (c2 == CPP_EOF \|\| c2 == CPP_EOL)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	302 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	303 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	304 preproc_lex_unfetch_byte(pp, c2);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	305 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	306 else if (c2 == '*')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	307 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	308 /* block comment */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	309 c = ' ';
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	310 for (;;)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	311 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	312 c2 = fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	313 if (c2 == CPP_EOL \|\| c2 == CPP_EOF)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	314 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	315 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	316 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	317 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	318 if (c2 == '*')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	319 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	320 /* maybe end of comment */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	321 c2 = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	322 if (c2 == '/')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	323 break;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	324 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	325 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	326 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	327 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	328 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	329 /* not a comment - restore lookahead character */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	330 preproc_lex_unfetch_byte(pp, c2);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	331 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	332 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	333 return c;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	334 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	335
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	336 struct token preproc_lex_next_token(struct preproc_info pp)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	337 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	338 int sline = pp -> lineno;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	339 int scol = pp -> column;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	340 char *strval = NULL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	341 int ttype = TOK_NONE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	342 int c, c2;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	343 int cl;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	344 struct strbuf *strbuf;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	345 struct token *t;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	346
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	347 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	348 if (c == CPP_EOF)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	349 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	350 if (pp -> nlseen == 0)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	351 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	352 c = CPP_EOL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	353 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	354 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	355
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	356 if (c == CPP_EOF)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	357 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	358 ttype = TOK_EOF;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	359 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	360 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	361 if (c == CPP_EOL)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	362 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	363 pp -> nlseen = 1;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	364 ttype = TOK_EOL;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	365 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	366 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	367
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	368 pp -> nlseen = 0;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	369 if (isspace(c))
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	370 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	371 while (isspace(c))
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	372 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	373 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	374 ttype = TOK_WSPACE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	375 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	376 }
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	377
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	378 switch (c)
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	379 {
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	380 case '?':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	381 ttype = TOK_QMARK;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	382 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	383
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	384 case ':':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	385 ttype = TOK_COLON;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	386 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	387
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	388 case ',':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	389 ttype = TOK_COMMA;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	390 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	391
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	392 case '(':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	393 ttype = TOK_OPAREN;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	394 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	395
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	396 case ')':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	397 ttype = TOK_CPAREN;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	398 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	399
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	400 case '{':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	401 ttype = TOK_OBRACE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	402 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	403
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	404 case '}':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	405 ttype = TOK_CBRACE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	406 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	407
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	408 case '[':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	409 ttype = TOK_OSQUARE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	410 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	411
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	412 case ']':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	413 ttype = TOK_CSQUARE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	414 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	415
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	416 case '~':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	417 ttype = TOK_COM;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	418 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	419
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	420 case ';':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	421 ttype = TOK_EOS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	422 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	423
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	424 /* and now for the possible multi character tokens */
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	425 case '#':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	426 ttype = TOK_HASH;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	427 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	428 if (c == '#')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	429 ttype = TOK_DBLHASH;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	430 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	431 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	432 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	433
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	434 case '^':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	435 ttype = TOK_XOR;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	436 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	437 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	438 ttype = TOK_XORASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	439 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	440 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	441 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	442
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	443 case '!':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	444 ttype = TOK_BNOT;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	445 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	446 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	447 ttype = TOK_NE;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	448 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	449 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	450 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	451
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	452 case '*':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	453 ttype = TOK_STAR;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	454 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	455 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	456 ttype = TOK_MULASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	457 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	458 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	459 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	460
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	461 case '/':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	462 ttype = TOK_DIV;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	463 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	464 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	465 ttype = TOK_DIVASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	466 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	467 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	468 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	469
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	470 case '=':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	471 ttype = TOK_ASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	472 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	473 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	474 ttype = TOK_EQ;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	475 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	476 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	477 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	478
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	479 case '%':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	480 ttype = TOK_MOD;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	481 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	482 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	483 ttype = TOK_MODASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	484 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	485 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	486 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	487
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	488 case '-':
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	489 ttype = TOK_SUB;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	490 c = preproc_lex_fetch_byte(pp);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	491 if (c == '=')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	492 ttype = TOK_SUBASS;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	493 else if (c == '-')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	494 ttype = TOK_DBLSUB;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	495 else if (c == '>')
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	496 ttype = TOK_ARROW;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	497 else
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	498 preproc_lex_unfetch_byte(pp, c);
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	499 goto out;
4b17780f2777 Checkpoint lwcc development William Astle <lost@l-w.ca> parents: diff changeset	500

295

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

1 /*

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

2 lwcc/lex.c

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

3

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

5

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

6 This file is part of LWTOOLS.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

7

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

8 LWTOOLS is free software: you can redistribute it and/or modify it under the

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

9 terms of the GNU General Public License as published by the Free Software

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

10 Foundation, either version 3 of the License, or (at your option) any later

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

11 version.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

12

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

13 This program is distributed in the hope that it will be useful, but WITHOUT

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

16 more details.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

17

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

18 You should have received a copy of the GNU General Public License along with

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

19 this program. If not, see <http://www.gnu.org/licenses/>.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

20 */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

21

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

22 #include <ctype.h>

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

23 #include <stdio.h>

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

24

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

25 #include <lw_alloc.h>

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

26

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

27 #include "cpp.h"

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

28 #include "strbuf.h"

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

29 #include "token.h"

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

30

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

31 /* fetch a raw input byte from the current file. Will return CPP_EOF if

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

32 EOF is encountered and CPP_EOL if an end of line sequence is encountered.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

33 End of line is defined as either CR, CRLF, LF, or LFCR. CPP_EOL is

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

34 returned on the first CR or LF encountered. The complementary CR or LF

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

35 is munched, if present, when the *next* character is read. This always

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

36 operates on file_stack.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

37

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

38 This function also accounts for line numbers in input files and also

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

39 character columns.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

40 */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

41 static int fetch_byte_ll(struct preproc_info *pp)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

42 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

43 int c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

44

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

45 if (pp -> eolstate != 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

46 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

47 pp -> lineno++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

48 pp -> column = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

49 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

50 c = getc(pp -> fp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

51 pp -> column++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

52 if (pp -> eolstate == 1)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

53 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

54 // just saw CR, munch LF

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

55 if (c == 10)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

56 c = getc(pp -> fp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

57 pp -> eolstate = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

58 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

59 else if (pp -> eolstate == 2)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

60 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

61 // just saw LF, much CR

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

62 if (c == 13)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

63 c = getc(pp -> fp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

64 pp -> eolstate = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

65 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

66

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

67 if (c == 10)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

68 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

69 // we have LF - end of line, flag to munch CR

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

70 pp -> eolstate = 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

71 c = CPP_EOL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

72 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

73 else if (c == 13)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

74 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

75 // we have CR - end of line, flag to munch LF

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

76 pp -> eolstate = 1;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

77 c = CPP_EOL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

78 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

79 else if (c == EOF)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

80 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

81 c = CPP_EOF;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

82 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

83 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

84 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

85

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

86 /* This function takes a sequence of bytes from the _ll function above

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

87 and does trigraph interpretation on it, but only if the global

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

88 trigraphs is nonzero. */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

89 static int fetch_byte_tg(struct preproc_info *pp)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

90 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

91 int c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

92

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

93 if (!pp -> trigraphs)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

94 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

95 c = fetch_byte_ll(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

96 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

97 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

98 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

99 /* we have to do the trigraph shit here */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

100 if (pp -> ra != CPP_NOUNG)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

101 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

102 if (pp -> qseen > 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

103 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

104 c = '?';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

105 pp -> qseen -= 1;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

106 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

107 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

108 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

109 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

110 c = pp -> ra;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

111 pp -> ra = CPP_NOUNG;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

112 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

113 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

114 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

115

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

116 c = fetch_byte_ll(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

117 while (c == '?')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

118 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

119 pp -> qseen++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

120 c = fetch_byte_ll(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

121 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

122

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

123 if (pp -> qseen >= 2)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

124 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

125 // we have a trigraph

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

126 switch (c)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

127 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

128 case '=':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

129 c = '#';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

130 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

131 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

132

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

133 case '/':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

134 c = '\\';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

135 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

136 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

137

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

138 case '\'':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

139 c = '^';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

140 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

141 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

142

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

143 case '(':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

144 c = '[';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

145 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

146 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

147

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

148 case ')':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

149 c = ']';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

150 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

151 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

152

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

153 case '!':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

154 c = '|';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

155 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

156 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

157

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

158 case '<':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

159 c = '{';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

160 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

161 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

162

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

163 case '>':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

164 c = '}';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

165 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

166 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

167

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

168 case '-':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

169 c = '~';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

170 pp -> qseen -= 2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

171 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

172 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

173 if (pp -> qseen > 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

174 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

175 pp -> ra = c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

176 c = '?';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

177 pp -> qseen--;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

178 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

179 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

180 else if (pp -> qseen > 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

181 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

182 pp -> ra = c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

183 c = '?';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

184 pp -> qseen--;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

185 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

186 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

187 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

188 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

189

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

190 /* This function puts a byte back onto the front of the input stream used

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

191 by fetch_byte(). Theoretically, an unlimited number of characters can

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

192 be unfetched. Line and column counting may be incorrect if unfetched

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

193 characters cross a token boundary. */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

194 static void preproc_lex_unfetch_byte(struct preproc_info *pp, int c)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

195 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

196 if (pp -> ungetbufl >= pp -> ungetbufs)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

197 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

198 pp -> ungetbufs += 100;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

199 pp -> ungetbuf = lw_realloc(pp -> ungetbuf, pp -> ungetbufs);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

200 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

201 pp -> ungetbuf[pp -> ungetbufl++] = c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

202 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

203

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

204 /* This function retrieves a byte from the input stream. It performs

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

205 backslash-newline splicing on the returned bytes. Any character

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

206 retrieved from the unfetch buffer is presumed to have already passed

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

207 the backslash-newline filter. */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

208 static int fetch_byte(struct preproc_info *pp)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

209 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

210 int c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

211

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

212 if (pp -> ungetbufl > 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

213 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

214 pp -> ungetbufl--;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

215 c = pp -> ungetbuf[pp -> ungetbufl];

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

216 if (pp -> ungetbufl == 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

217 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

218 lw_free(pp -> ungetbuf);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

219 pp -> ungetbuf = NULL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

220 pp -> ungetbufs = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

221 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

222 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

223 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

224

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

225 again:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

226 if (pp -> unget != CPP_NOUNG)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

227 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

228 c = pp -> unget;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

229 pp -> unget = CPP_NOUNG;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

230 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

231 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

232 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

233 c = fetch_byte_tg(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

234 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

235 if (c == '\\')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

236 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

237 int c2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

238 c2 = fetch_byte_tg(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

239 if (c2 == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

240 goto again;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

241 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

242 pp -> unget = c2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

243 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

244 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

245 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

246

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

247

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

248

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

249 /*

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

250 Lex a token off the current input file.

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

251

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

252 Returned tokens are as follows:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

253

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

254 * all words starting with [a-zA-Z_] are returned as TOK_IDENT

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

255 * numbers are returned as their appropriate type

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

256 * all whitespace in a sequence, including comments, is returned as

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

257 a single instance of TOK_WSPACE

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

258 * TOK_EOL is returned in the case of the end of a line

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

259 * TOK_EOF is returned when the end of the file is reached

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

260 * If no TOK_EOL appears before TOK_EOF, a TOK_EOL will be synthesised

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

261 * Any symbolic operator, etc., recognized by C will be returned as such

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

262 a token

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

263 * TOK_HASH will be returned for a #

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

264 * trigraphs will be interpreted

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

265 * backslash-newline will be interpreted

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

266 * any instance of CR, LF, CRLF, or LFCR will be interpreted as TOK_EOL

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

267 */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

268

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

269

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

270 static int preproc_lex_fetch_byte(struct preproc_info *pp)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

271 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

272 int c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

273 c = fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

274 if (c == CPP_EOF && pp -> eolseen == 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

275 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

276 preproc_throw_warning(pp, "No newline at end of file");

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

277 pp -> eolseen = 1;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

278 return CPP_EOL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

279 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

280

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

281 if (c == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

282 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

283 pp -> eolseen = 1;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

284 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

285 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

286

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

287 pp -> eolseen = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

288

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

289 /* convert comments to a single space here */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

290 if (c == '/')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

291 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

292 int c2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

293 c2 = fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

294 if (c2 == '/')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

295 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

296 /* single line comment */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

297 c = ' ';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

298 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

299 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

300 c2 = fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

301 if (c2 == CPP_EOF || c2 == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

302 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

303 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

304 preproc_lex_unfetch_byte(pp, c2);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

305 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

306 else if (c2 == '*')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

307 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

308 /* block comment */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

309 c = ' ';

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

310 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

311 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

312 c2 = fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

313 if (c2 == CPP_EOL || c2 == CPP_EOF)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

314 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

315 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

316 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

317 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

318 if (c2 == '*')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

319 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

320 /* maybe end of comment */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

321 c2 = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

322 if (c2 == '/')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

323 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

324 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

325 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

326 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

327 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

328 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

329 /* not a comment - restore lookahead character */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

330 preproc_lex_unfetch_byte(pp, c2);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

331 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

332 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

333 return c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

334 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

335

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

336 struct token *preproc_lex_next_token(struct preproc_info *pp)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

337 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

338 int sline = pp -> lineno;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

339 int scol = pp -> column;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

340 char *strval = NULL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

341 int ttype = TOK_NONE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

342 int c, c2;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

343 int cl;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

344 struct strbuf *strbuf;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

345 struct token *t;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

346

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

347 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

348 if (c == CPP_EOF)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

349 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

350 if (pp -> nlseen == 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

351 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

352 c = CPP_EOL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

353 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

354 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

355

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

356 if (c == CPP_EOF)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

357 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

358 ttype = TOK_EOF;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

359 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

360 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

361 if (c == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

362 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

363 pp -> nlseen = 1;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

364 ttype = TOK_EOL;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

365 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

366 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

367

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

368 pp -> nlseen = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

369 if (isspace(c))

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

370 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

371 while (isspace(c))

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

372 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

373 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

374 ttype = TOK_WSPACE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

375 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

376 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

377

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

378 switch (c)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

379 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

380 case '?':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

381 ttype = TOK_QMARK;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

382 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

383

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

384 case ':':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

385 ttype = TOK_COLON;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

386 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

387

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

388 case ',':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

389 ttype = TOK_COMMA;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

390 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

391

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

392 case '(':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

393 ttype = TOK_OPAREN;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

394 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

395

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

396 case ')':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

397 ttype = TOK_CPAREN;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

398 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

399

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

400 case '{':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

401 ttype = TOK_OBRACE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

402 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

403

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

404 case '}':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

405 ttype = TOK_CBRACE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

406 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

407

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

408 case '[':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

409 ttype = TOK_OSQUARE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

410 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

411

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

412 case ']':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

413 ttype = TOK_CSQUARE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

414 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

415

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

416 case '~':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

417 ttype = TOK_COM;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

418 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

419

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

420 case ';':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

421 ttype = TOK_EOS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

422 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

423

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

424 /* and now for the possible multi character tokens */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

425 case '#':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

426 ttype = TOK_HASH;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

427 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

428 if (c == '#')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

429 ttype = TOK_DBLHASH;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

430 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

431 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

432 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

433

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

434 case '^':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

435 ttype = TOK_XOR;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

436 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

437 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

438 ttype = TOK_XORASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

439 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

440 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

441 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

442

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

443 case '!':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

444 ttype = TOK_BNOT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

445 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

446 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

447 ttype = TOK_NE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

448 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

449 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

450 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

451

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

452 case '*':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

453 ttype = TOK_STAR;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

454 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

455 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

456 ttype = TOK_MULASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

457 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

458 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

459 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

460

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

461 case '/':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

462 ttype = TOK_DIV;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

463 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

464 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

465 ttype = TOK_DIVASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

466 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

467 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

468 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

469

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

470 case '=':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

471 ttype = TOK_ASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

472 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

473 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

474 ttype = TOK_EQ;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

475 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

476 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

477 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

478

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

479 case '%':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

480 ttype = TOK_MOD;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

481 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

482 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

483 ttype = TOK_MODASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

484 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

485 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

486 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

487

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

488 case '-':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

489 ttype = TOK_SUB;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

490 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

491 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

492 ttype = TOK_SUBASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

493 else if (c == '-')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

494 ttype = TOK_DBLSUB;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

495 else if (c == '>')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

496 ttype = TOK_ARROW;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

497 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

498 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

499 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

500

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

501 case '+':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

502 ttype = TOK_ADD;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

503 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

504 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

505 ttype = TOK_ADDASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

506 else if (c == '+')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

507 ttype = TOK_DBLADD;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

508 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

509 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

510 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

511

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

512

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

513 case '&':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

514 ttype = TOK_BWAND;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

515 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

516 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

517 ttype = TOK_BWANDASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

518 else if (c == '&')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

519 ttype = TOK_BAND;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

520 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

521 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

522 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

523

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

524 case '|':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

525 ttype = TOK_BWOR;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

526 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

527 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

528 ttype = TOK_BWORASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

529 else if (c == '|')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

530 ttype = TOK_BOR;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

531 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

532 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

533 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

534

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

535 case '<':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

536 ttype = TOK_LT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

537 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

538 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

539 ttype = TOK_LE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

540 else if (c == '<')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

541 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

542 ttype = TOK_LSH;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

543 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

544 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

545 ttype = TOK_LSHASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

546 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

547 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

548 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

549 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

550 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

551 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

552

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

553

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

554 case '>':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

555 ttype = TOK_GT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

556 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

557 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

558 ttype = TOK_GE;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

559 else if (c == '>')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

560 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

561 ttype = TOK_RSH;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

562 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

563 if (c == '=')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

564 ttype = TOK_RSHASS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

565 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

566 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

567 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

568 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

569 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

570 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

571

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

572 case '\'':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

573 /* character constant - turns into a uint */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

574 chrlit:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

575 cl = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

576 strbuf = strbuf_new();

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

577 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

578 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

579 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

580 if (c == CPP_EOF || c == CPP_EOL || c == '\'')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

581 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

582 cl++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

583 if (c == '\\')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

584 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

585 strbuf_add(strbuf, '\\');

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

586 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

587 if (c == CPP_EOF || c == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

588 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

589 preproc_throw_error(pp, "Invalid character constant");

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

590 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

591 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

592 cl++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

593 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

594 continue;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

595 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

596 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

597 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

598 if (cl == 0)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

599 preproc_throw_error(pp, "Invalid character constant");

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

600 strval = strbuf_end(strbuf);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

601 ttype = TOK_CHR_LIT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

602 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

603

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

604 case '"':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

605 strlit:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

606 /* string literal */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

607 strbuf = strbuf_new();

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

608 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

609 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

610 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

611 if (c == CPP_EOF || c == CPP_EOL || c == '"')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

612 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

613 if (c == '\\')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

614 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

615 strbuf_add(strbuf, '\\');

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

616 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

617 if (c == CPP_EOF || c == CPP_EOL)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

618 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

619 preproc_throw_error(pp, "Invalid string constant");

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

620 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

621 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

622 cl++;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

623 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

624 continue;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

625 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

626 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

627 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

628 strval = strbuf_end(strbuf);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

629 ttype = TOK_STR_LIT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

630 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

631

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

632 case 'L':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

633 /* check for wide string or wide char const */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

634 c2 = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

635 if (c2 == '\'')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

636 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

637 goto chrlit;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

638 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

639 else if (c2 == '"')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

640 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

641 goto strlit;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

642 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

643 preproc_lex_unfetch_byte(pp, c2);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

644 /* fall through for identifier */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

645 case '_':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

646 case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

647 case 'g': case 'h': case 'i': case 'j': case 'k': case 'l':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

648 case 'm': case 'n': case 'o': case 'p': case 'q': case 'r':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

649 case 's': case 't': case 'u': case 'v': case 'w': case 'x':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

650 case 'y': case 'z':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

651 case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

652 case 'G': case 'H': case 'I': case 'J': case 'K':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

653 case 'M': case 'N': case 'O': case 'P': case 'Q': case 'R':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

654 case 'S': case 'T': case 'U': case 'V': case 'W': case 'X':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

655 case 'Y': case 'Z':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

656 /* we have an identifier here */

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

657 strbuf = strbuf_new();

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

658 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

659 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

660 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

661 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

662 if ((c == '_') || (c >= '0' && c <= '9') || (c >= 'A' && c <= 'Z') || (c >= 'a' && c <= 'z'))

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

663 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

664 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

665 continue;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

666 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

667 else

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

668 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

669 strbuf_add(strbuf, 0);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

670 strval = strbuf_end(strbuf);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

671 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

672 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

673 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

674 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

675 ttype = TOK_IDENT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

676 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

677

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

678 case '.':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

679 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

680 if (c >= '0' && c <= '9')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

681 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

682 strbuf = strbuf_new();

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

683 strbuf_add(strbuf, '.');

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

684 goto numlit;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

685 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

686 else if (c == '.')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

687 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

688 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

689 if (c == '.')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

690 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

691 ttype = TOK_ELLIPSIS;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

692 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

693 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

694 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

695 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

696 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

697 ttype = TOK_DOT;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

698 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

699

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

700 case '0': case '1': case '2': case '3': case '4':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

701 case '5': case '6': case '7': case '8': case '9':

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

702 strbuf = strbuf_new();

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

703 numlit:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

704 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

705 for (;;)

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

706 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

707 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

708 if (!((c == '_') || (c >= '0' && c <= '9') || (c >= 'A' && c <= 'Z') || (c >= 'a' && c <= 'z')))

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

709 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

710 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

711 if (c == 'e' || c == 'E' || c == 'p' || c == 'P')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

712 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

713 c = preproc_lex_fetch_byte(pp);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

714 if (c == '+' || c == '-')

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

715 {

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

716 strbuf_add(strbuf, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

717 continue;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

718 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

719 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

720 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

721 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

722 strval = strbuf_end(strbuf);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

723 preproc_lex_unfetch_byte(pp, c);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

724 goto out;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

725

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

726 default:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

727 ttype = TOK_CHAR;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

728 strval = lw_alloc(2);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

729 strval[0] = c;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

730 strval[1] = 0;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

731 break;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

732 }

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

733 out:

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

734 t = token_create(ttype, strval, sline, scol, pp -> fn);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

735 lw_free(strval);

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

736 return t;

4b17780f2777 Checkpoint lwcc development

William Astle <lost@l-w.ca>

parents:

diff changeset

737 }

Mercurial > hg > index.cgi

annotate lwcc/lex.c @ 295:4b17780f2777 ccdev