00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013 #ifndef _REUTERSPARSER_HPP
00014 #define _REUTERSPARSER_HPP
00015 #include "Parser.hpp"
00016 #include "TextHandler.hpp"
00017 namespace lemur
00018 {
00019 namespace parse
00020 {
00021
00033
00034
00035
00036 class ReutersParser : public lemur::api::Parser {
00037
00038 public:
00039 static const string identifier;
00040
00041 ReutersParser();
00042
00044 void parseFile (const string &filename);
00045 void parseBuffer (char * buf, int len);
00046 long fileTell()const;
00047
00048 private:
00050 void doParse();
00051
00053 int state;
00054
00055 };
00056 }
00057 }
00058
00059 #endif