41d97ad79cdc56e5c032b9e47a470da9cc0c94fe
[gedcom-parse.git] / gedcom_lohi.lex
1 /*  This program is free software; you can redistribute it and/or modify  *
2  *  it under the terms of the GNU General Public License as published by  *
3  *  the Free Software Foundation; either version 2 of the License, or     *
4  *  (at your option) any later version.                                   *
5
6  (C) 2001 by The Genes Development Team
7  Original author: Peter Verthez (Peter.Verthez@advalvas.be)
8 */
9
10 /* $Id$ */
11 /* $Name$ */
12
13 /* In low-high order, a space is encoded as 0x20 0x00 */
14 /* i.e. this is utf-16-le */
15
16 %{
17 #undef IN_LEX    /* include only a specific part of the following file */
18 #include "gedcom_lex_common.c"
19 %}
20
21 %s NORMAL
22 %s EXPECT_TAG
23
24 alpha        [A-Za-z_]\x00
25 digit        [0-9]\x00
26 delim        \x20\x00
27 tab          [\t]\x00
28 hash         #\x00
29 literal_at   @\x00@\x00
30 otherchar    [\x21-\x22\x24-\x2F\x3A-\x3F\x5B-\x5E\x60\x7B-\x7E\x80-\xFF]\x00|[\x00-\xFF][\x01-\xFF]
31 terminator   \x0D\x00|\x0A\x00|\x0D\x00\x0A\x00|\x0A\x00\x0D\x00
32
33 any_char     {alpha}|{digit}|{otherchar}|{delim}|{hash}|{literal_at}
34 any_but_delim {alpha}|{digit}|{otherchar}|{hash}|{literal_at}
35 non_at       {alpha}|{digit}|{otherchar}|{delim}|{hash}
36 alphanum     {alpha}|{digit}
37 gen_delim    {delim}|{tab}
38
39 escape       @\x00#\x00{any_char}+@\x00
40 pointer      @\x00{alphanum}{non_at}+@\x00
41
42 %%
43
44 %{
45 #define IN_LEX    /* include only a specific part of the following file */
46 #include "gedcom_lex_common.c"
47
48 ACTION_BEFORE_REGEXPS
49   
50 %}
51
52 <INITIAL>{gen_delim}* /* ignore leading whitespace (also tabs) */
53
54 <INITIAL>\x00[0]{digit}+  ACTION_0_DIGITS
55
56 <INITIAL>{digit}+         ACTION_DIGITS
57
58 <EXPECT_TAG>A\x00B\x00B\x00R\x00  MKTAGACTION(ABBR)
59 <EXPECT_TAG>A\x00D\x00D\x00R\x00  MKTAGACTION(ADDR)
60 <EXPECT_TAG>A\x00D\x00R\x001\x00  MKTAGACTION(ADR1)
61 <EXPECT_TAG>A\x00D\x00R\x002\x00  MKTAGACTION(ADR2)
62 <EXPECT_TAG>A\x00D\x00O\x00P\x00  MKTAGACTION(ADOP)
63 <EXPECT_TAG>A\x00F\x00N\x00   MKTAGACTION(AFN)
64 <EXPECT_TAG>A\x00G\x00E\x00   MKTAGACTION(AGE)
65 <EXPECT_TAG>A\x00G\x00N\x00C\x00  MKTAGACTION(AGNC)
66 <EXPECT_TAG>A\x00L\x00I\x00A\x00  MKTAGACTION(ALIA)
67 <EXPECT_TAG>A\x00N\x00C\x00E\x00  MKTAGACTION(ANCE)
68 <EXPECT_TAG>A\x00N\x00C\x00I\x00  MKTAGACTION(ANCI)
69 <EXPECT_TAG>A\x00N\x00U\x00L\x00  MKTAGACTION(ANUL)
70 <EXPECT_TAG>A\x00S\x00S\x00O\x00  MKTAGACTION(ASSO)
71 <EXPECT_TAG>A\x00U\x00T\x00H\x00  MKTAGACTION(AUTH)
72 <EXPECT_TAG>B\x00A\x00P\x00L\x00  MKTAGACTION(BAPL)
73 <EXPECT_TAG>B\x00A\x00P\x00M\x00  MKTAGACTION(BAPM)
74 <EXPECT_TAG>B\x00A\x00R\x00M\x00  MKTAGACTION(BARM)
75 <EXPECT_TAG>B\x00A\x00S\x00M\x00  MKTAGACTION(BASM)
76 <EXPECT_TAG>B\x00I\x00R\x00T\x00  MKTAGACTION(BIRT)
77 <EXPECT_TAG>B\x00L\x00E\x00S\x00  MKTAGACTION(BLES)
78 <EXPECT_TAG>B\x00L\x00O\x00B\x00  MKTAGACTION(BLOB)
79 <EXPECT_TAG>B\x00U\x00R\x00I\x00  MKTAGACTION(BURI)
80 <EXPECT_TAG>C\x00A\x00L\x00N\x00  MKTAGACTION(CALN)
81 <EXPECT_TAG>C\x00A\x00S\x00T\x00  MKTAGACTION(CAST)
82 <EXPECT_TAG>C\x00A\x00U\x00S\x00  MKTAGACTION(CAUS)
83 <EXPECT_TAG>C\x00E\x00N\x00S\x00  MKTAGACTION(CENS)
84 <EXPECT_TAG>C\x00H\x00A\x00N\x00  MKTAGACTION(CHAN)
85 <EXPECT_TAG>C\x00H\x00A\x00R\x00  MKTAGACTION(CHAR)
86 <EXPECT_TAG>C\x00H\x00I\x00L\x00  MKTAGACTION(CHIL)
87 <EXPECT_TAG>C\x00H\x00R\x00   MKTAGACTION(CHR)
88 <EXPECT_TAG>C\x00H\x00R\x00A\x00  MKTAGACTION(CHRA)
89 <EXPECT_TAG>C\x00I\x00T\x00Y\x00  MKTAGACTION(CITY)
90 <EXPECT_TAG>C\x00O\x00N\x00C\x00  MKTAGACTION(CONC)
91 <EXPECT_TAG>C\x00O\x00N\x00F\x00  MKTAGACTION(CONF)
92 <EXPECT_TAG>C\x00O\x00N\x00L\x00  MKTAGACTION(CONL)
93 <EXPECT_TAG>C\x00O\x00N\x00T\x00  MKTAGACTION(CONT)
94 <EXPECT_TAG>C\x00O\x00P\x00R\x00  MKTAGACTION(COPR)
95 <EXPECT_TAG>C\x00O\x00R\x00P\x00  MKTAGACTION(CORP)
96 <EXPECT_TAG>C\x00R\x00E\x00M\x00  MKTAGACTION(CREM)
97 <EXPECT_TAG>C\x00T\x00R\x00Y\x00  MKTAGACTION(CTRY)
98 <EXPECT_TAG>D\x00A\x00T\x00A\x00  MKTAGACTION(DATA)
99 <EXPECT_TAG>D\x00A\x00T\x00E\x00  MKTAGACTION(DATE)
100 <EXPECT_TAG>D\x00E\x00A\x00T\x00  MKTAGACTION(DEAT)
101 <EXPECT_TAG>D\x00E\x00S\x00C\x00  MKTAGACTION(DESC)
102 <EXPECT_TAG>D\x00E\x00S\x00I\x00  MKTAGACTION(DESI)
103 <EXPECT_TAG>D\x00E\x00S\x00T\x00  MKTAGACTION(DEST)
104 <EXPECT_TAG>D\x00I\x00V\x00   MKTAGACTION(DIV)
105 <EXPECT_TAG>D\x00I\x00V\x00F\x00  MKTAGACTION(DIVF)
106 <EXPECT_TAG>D\x00S\x00C\x00R\x00  MKTAGACTION(DSCR)
107 <EXPECT_TAG>E\x00D\x00U\x00C\x00  MKTAGACTION(EDUC)
108 <EXPECT_TAG>E\x00M\x00I\x00G\x00  MKTAGACTION(EMIG)
109 <EXPECT_TAG>E\x00N\x00D\x00L\x00  MKTAGACTION(ENDL)
110 <EXPECT_TAG>E\x00N\x00G\x00A\x00  MKTAGACTION(ENGA)
111 <EXPECT_TAG>E\x00V\x00E\x00N\x00  MKTAGACTION(EVEN)
112 <EXPECT_TAG>F\x00A\x00M\x00   MKTAGACTION(FAM)
113 <EXPECT_TAG>F\x00A\x00M\x00C\x00  MKTAGACTION(FAMC)
114 <EXPECT_TAG>F\x00A\x00M\x00F\x00  MKTAGACTION(FAMF)
115 <EXPECT_TAG>F\x00A\x00M\x00S\x00  MKTAGACTION(FAMS)
116 <EXPECT_TAG>F\x00C\x00O\x00M\x00  MKTAGACTION(FCOM)
117 <EXPECT_TAG>F\x00I\x00L\x00E\x00  MKTAGACTION(FILE)
118 <EXPECT_TAG>F\x00O\x00R\x00M\x00  MKTAGACTION(FORM)
119 <EXPECT_TAG>G\x00E\x00D\x00C\x00  MKTAGACTION(GEDC)
120 <EXPECT_TAG>G\x00I\x00V\x00N\x00  MKTAGACTION(GIVN)
121 <EXPECT_TAG>G\x00R\x00A\x00D\x00  MKTAGACTION(GRAD)
122 <EXPECT_TAG>H\x00E\x00A\x00D\x00  MKTAGACTION(HEAD)
123 <EXPECT_TAG>H\x00U\x00S\x00B\x00  MKTAGACTION(HUSB)
124 <EXPECT_TAG>I\x00D\x00N\x00O\x00  MKTAGACTION(IDNO)
125 <EXPECT_TAG>I\x00M\x00M\x00I\x00  MKTAGACTION(IMMI)
126 <EXPECT_TAG>I\x00N\x00D\x00I\x00  MKTAGACTION(INDI)
127 <EXPECT_TAG>L\x00A\x00N\x00G\x00  MKTAGACTION(LANG)
128 <EXPECT_TAG>L\x00E\x00G\x00A\x00  MKTAGACTION(LEGA)
129 <EXPECT_TAG>M\x00A\x00R\x00B\x00  MKTAGACTION(MARB)
130 <EXPECT_TAG>M\x00A\x00R\x00C\x00  MKTAGACTION(MARC)
131 <EXPECT_TAG>M\x00A\x00R\x00L\x00  MKTAGACTION(MARL)
132 <EXPECT_TAG>M\x00A\x00R\x00R\x00  MKTAGACTION(MARR)
133 <EXPECT_TAG>M\x00A\x00R\x00S\x00  MKTAGACTION(MARS)
134 <EXPECT_TAG>M\x00E\x00D\x00I\x00  MKTAGACTION(MEDI)
135 <EXPECT_TAG>N\x00A\x00M\x00E\x00  MKTAGACTION(NAME)
136 <EXPECT_TAG>N\x00A\x00T\x00I\x00  MKTAGACTION(NATI)
137 <EXPECT_TAG>N\x00A\x00T\x00U\x00  MKTAGACTION(NATU)
138 <EXPECT_TAG>N\x00C\x00H\x00I\x00  MKTAGACTION(NCHI)
139 <EXPECT_TAG>N\x00I\x00C\x00K\x00  MKTAGACTION(NICK)
140 <EXPECT_TAG>N\x00M\x00R\x00   MKTAGACTION(NMR)
141 <EXPECT_TAG>N\x00O\x00T\x00E\x00  MKTAGACTION(NOTE)
142 <EXPECT_TAG>N\x00P\x00F\x00X\x00  MKTAGACTION(NPFX)
143 <EXPECT_TAG>N\x00S\x00F\x00X\x00  MKTAGACTION(NSFX)
144 <EXPECT_TAG>O\x00B\x00J\x00E\x00  MKTAGACTION(OBJE)
145 <EXPECT_TAG>O\x00C\x00C\x00U\x00  MKTAGACTION(OCCU)
146 <EXPECT_TAG>O\x00R\x00D\x00I\x00  MKTAGACTION(ORDI)
147 <EXPECT_TAG>O\x00R\x00D\x00N\x00  MKTAGACTION(ORDN)
148 <EXPECT_TAG>P\x00A\x00G\x00E\x00  MKTAGACTION(PAGE)
149 <EXPECT_TAG>P\x00E\x00D\x00I\x00  MKTAGACTION(PEDI)
150 <EXPECT_TAG>P\x00H\x00O\x00N\x00  MKTAGACTION(PHON)
151 <EXPECT_TAG>P\x00L\x00A\x00C\x00  MKTAGACTION(PLAC)
152 <EXPECT_TAG>P\x00O\x00S\x00T\x00  MKTAGACTION(POST)
153 <EXPECT_TAG>P\x00R\x00O\x00B\x00  MKTAGACTION(PROB)
154 <EXPECT_TAG>P\x00R\x00O\x00P\x00  MKTAGACTION(PROP)
155 <EXPECT_TAG>P\x00U\x00B\x00L\x00  MKTAGACTION(PUBL)
156 <EXPECT_TAG>Q\x00U\x00A\x00Y\x00  MKTAGACTION(QUAY)
157 <EXPECT_TAG>R\x00E\x00F\x00N\x00  MKTAGACTION(REFN)
158 <EXPECT_TAG>R\x00E\x00L\x00A\x00  MKTAGACTION(RELA)
159 <EXPECT_TAG>R\x00E\x00L\x00I\x00  MKTAGACTION(RELI)
160 <EXPECT_TAG>R\x00E\x00P\x00O\x00  MKTAGACTION(REPO)
161 <EXPECT_TAG>R\x00E\x00S\x00I\x00  MKTAGACTION(RESI)
162 <EXPECT_TAG>R\x00E\x00S\x00N\x00  MKTAGACTION(RESN)
163 <EXPECT_TAG>R\x00E\x00T\x00I\x00  MKTAGACTION(RETI)
164 <EXPECT_TAG>R\x00F\x00N\x00   MKTAGACTION(RFN)
165 <EXPECT_TAG>R\x00I\x00N\x00   MKTAGACTION(RIN)
166 <EXPECT_TAG>R\x00O\x00L\x00E\x00  MKTAGACTION(ROLE)
167 <EXPECT_TAG>S\x00E\x00X\x00   MKTAGACTION(SEX)
168 <EXPECT_TAG>S\x00L\x00G\x00C\x00  MKTAGACTION(SLGC)
169 <EXPECT_TAG>S\x00L\x00G\x00S\x00  MKTAGACTION(SLGS)
170 <EXPECT_TAG>S\x00O\x00U\x00R\x00  MKTAGACTION(SOUR)
171 <EXPECT_TAG>S\x00P\x00F\x00X\x00  MKTAGACTION(SPFX)
172 <EXPECT_TAG>S\x00S\x00N\x00   MKTAGACTION(SSN)
173 <EXPECT_TAG>S\x00T\x00A\x00E\x00  MKTAGACTION(STAE)
174 <EXPECT_TAG>S\x00T\x00A\x00T\x00  MKTAGACTION(STAT)
175 <EXPECT_TAG>S\x00U\x00B\x00M\x00  MKTAGACTION(SUBM)
176 <EXPECT_TAG>S\x00U\x00B\x00N\x00  MKTAGACTION(SUBN)
177 <EXPECT_TAG>S\x00U\x00R\x00N\x00  MKTAGACTION(SURN)
178 <EXPECT_TAG>T\x00E\x00M\x00P\x00  MKTAGACTION(TEMP)
179 <EXPECT_TAG>T\x00E\x00X\x00T\x00  MKTAGACTION(TEXT)
180 <EXPECT_TAG>T\x00I\x00M\x00E\x00  MKTAGACTION(TIME)
181 <EXPECT_TAG>T\x00I\x00T\x00L\x00  MKTAGACTION(TITL)
182 <EXPECT_TAG>T\x00R\x00L\x00R\x00  MKTAGACTION(TRLR)
183 <EXPECT_TAG>T\x00Y\x00P\x00E\x00  MKTAGACTION(TYPE)
184 <EXPECT_TAG>V\x00E\x00R\x00S\x00  MKTAGACTION(VERS)
185 <EXPECT_TAG>W\x00I\x00F\x00E\x00  MKTAGACTION(WIFE)
186 <EXPECT_TAG>W\x00I\x00L\x00L\x00  MKTAGACTION(WILL)
187      
188 <EXPECT_TAG>{alphanum}+  ACTION_ALPHANUM
189
190 {delim}                  ACTION_DELIM
191
192 {any_but_delim}          ACTION_ANY
193
194 {escape}/{non_at}        ACTION_ESCAPE
195
196 {pointer}                ACTION_POINTER
197
198 {gen_delim}*{terminator} ACTION_TERMINATOR
199
200 <<EOF>>                  ACTION_EOF
201
202 .                        ACTION_UNEXPECTED
203
204 %%
205
206 int yywrap()
207 {
208   return 1;
209 }
210
211 #ifdef LEXER_TEST
212 int gedcom_lex()
213 {
214   return gedcom_lohi_lex();
215 }
216
217 int main()
218 {
219   return test_loop(TWO_BYTE_LOHI, "UNICODE");
220 }
221 #endif