Move setlocale call to gedcom_init.
[gedcom-parse.git] / gedcom / multilex.c
1 /* The lexer multiplexer for Gedcom.
2    Copyright (C) 2001,2002 The Genes Development Team
3    This file is part of the Gedcom parser library.
4    Contributed by Peter Verthez <Peter.Verthez@advalvas.be>, 2001.
5
6    The Gedcom parser library is free software; you can redistribute it
7    and/or modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
10
11    The Gedcom parser library is distributed in the hope that it will be
12    useful, but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
15
16    You should have received a copy of the GNU Lesser General Public
17    License along with the Gedcom parser library; if not, write to the
18    Free Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
19    02111-1307 USA.  */
20
21 /* $Id$ */
22 /* $Name$ */
23
24 #include "gedcom_internal.h"
25 #include "multilex.h"
26 #include "encoding.h"
27 #include "xref.h"
28
29 int line_no = 0;
30
31 typedef int (*lex_func)(void);
32 lex_func lf;
33
34 #define NEW_MODEL_FILE "new.ged"
35
36 int lexer_init(ENCODING enc, FILE* f)
37 {
38   if (enc == ONE_BYTE) {
39     lf  = &gedcom_1byte_lex;
40     gedcom_1byte_myinit(f);
41     set_encoding_width(enc);
42     return open_conv_to_internal("ASCII");
43   }
44   else if (enc == TWO_BYTE_HILO) {
45     lf  = &gedcom_hilo_lex;
46     gedcom_hilo_myinit(f);
47     set_encoding_width(enc);
48     return open_conv_to_internal("UNICODE");
49   }
50   else if (enc == TWO_BYTE_LOHI) {
51     lf  = &gedcom_lohi_lex;
52     gedcom_lohi_myinit(f);
53     set_encoding_width(enc);
54     return open_conv_to_internal("UNICODE");
55   }
56   else {
57     return 0;
58   }
59 }
60
61 void lexer_close()
62 {
63   close_conv_to_internal();
64 }
65
66 int gedcom_lex()
67 {
68   return (*lf)();
69 }
70
71 int determine_encoding(FILE* f)
72 {
73   char first[2];
74   int read;
75
76   read = fread(first, 1, 2, f);
77   if (read != 2) {
78     gedcom_warning(_("Error reading from input file: %s"), strerror(errno));
79     return ONE_BYTE;
80   }
81   else if ((first[0] == '0') && (first[1] == ' ')) {
82     gedcom_debug_print(_("One-byte encoding"));
83     if (fseek(f, 0, 0) != 0)
84       gedcom_warning(_("Error positioning input file: %s"), strerror(errno));
85     return ONE_BYTE;
86   }
87   else if ((first[0] == '\0') && (first[1] == '0'))
88   {
89     gedcom_debug_print(_("Two-byte encoding, high-low"));
90     if (fseek(f, 0, 0) != 0)
91       gedcom_warning(_("Error positioning input file: %s"), strerror(errno));
92     return TWO_BYTE_HILO;
93   }
94   else if ((first[0] == '\xFE') && (first[1] == '\xFF'))
95   {
96     gedcom_debug_print(_("Two-byte encoding, high-low, with BOM"));
97     return TWO_BYTE_HILO;
98   }
99   else if ((first[0] == '0') && (first[1] == '\0'))
100   {
101     gedcom_debug_print(_("Two-byte encoding, low-high"));
102     if (fseek(f, 0, 0) != 0)
103       gedcom_warning(_("Error positioning input file: %s"), strerror(errno));
104     return TWO_BYTE_LOHI;
105   }
106   else if ((first[0] == '\xFF') && (first[1] == '\xFE'))
107   {
108     gedcom_debug_print(_("Two-byte encoding, low-high, with BOM"));
109     return TWO_BYTE_LOHI;
110   }
111   else {
112     gedcom_warning(_("Unknown encoding, falling back to one-byte"));
113     if (fseek(f, 0, 0) != 0)
114       gedcom_warning(_("Error positioning input file: %s"), strerror(errno));
115     return ONE_BYTE;
116   }
117 }
118
119 int init_called = 0;
120
121 void gedcom_init()
122 {
123   init_called = 1;
124   update_gconv_search_path();
125   setlocale(LC_ALL, "");
126 }
127
128 int gedcom_parse_file(const char* file_name)
129 {
130   ENCODING enc;
131   int result = 1;
132   FILE* file;
133   char *textdom, *save_textdom;
134
135   textdom = textdomain(NULL);
136   if (!textdom) {
137     gedcom_error(_("Could not retrieve text domain: %s"), strerror(errno));
138     return result;
139   }
140   
141   save_textdom = strdup(textdom);
142   if (! save_textdom) {
143     MEMORY_ERROR;
144     return result;
145   }
146   
147   if (! bindtextdomain(PACKAGE, LOCALEDIR)
148       || ! bind_textdomain_codeset(PACKAGE, INTERNAL_ENCODING)
149       || ! textdomain(PACKAGE)) {
150     gedcom_error(_("Could not set text domain: %s"), strerror(errno));
151     return result;
152   }
153
154   if (!init_called) {
155     gedcom_error(_("Internal error: GEDCOM parser not initialized"));
156   }
157   else {
158     file = fopen(file_name, "r");
159     if (!file) {
160       gedcom_error(_("Could not open file '%s': %s"),
161                    file_name, strerror(errno));
162     }
163     else {
164       init_encodings();
165       enc = determine_encoding(file);
166       
167       if (lexer_init(enc, file)) {
168         line_no = 0;
169         make_xref_table();
170         result = gedcom_parse();
171         line_no = 0;
172         if (result == 0)
173           result = check_xref_table();
174       }
175       lexer_close();
176       fclose(file);
177     }
178   }
179
180   if (! textdomain(save_textdom)) {
181     gedcom_error(_("Could not restore text domain: %s"), strerror(errno));
182     return result;
183   }
184   return result;
185 }
186
187 int gedcom_new_model()
188 {
189   int result = 1;
190   FILE* file;
191
192   file = fopen(NEW_MODEL_FILE, "r");
193   if (file) {
194     fclose(file);
195     result = gedcom_parse_file(NEW_MODEL_FILE);
196   }
197   else {
198     char* filename = (char*) malloc(strlen(PKGDATADIR) + strlen(NEW_MODEL_FILE)
199                                     + 2);
200     if (!filename)
201       MEMORY_ERROR;
202     else {
203       sprintf(filename, "%s/%s", PKGDATADIR, NEW_MODEL_FILE);
204       result = gedcom_parse_file(filename);
205       free(filename);
206     }
207   }
208   return result;
209 }
210
211 int gedcom_check_version(int major, int minor, int patch)
212 {
213   if (major < GEDCOM_PARSE_VERSION_MAJOR)
214     return 1;
215   else if (major > GEDCOM_PARSE_VERSION_MAJOR)
216     return 0;
217   else if (minor < GEDCOM_PARSE_VERSION_MINOR)
218     return 1;
219   else if (minor > GEDCOM_PARSE_VERSION_MINOR)
220     return 0;
221   else if (patch <= GEDCOM_PARSE_VERSION_PATCH)
222     return 1;
223   else
224     return 0;
225 }