added perl socket blocking where available
[spider.git] / perl / cluster.pl
1 #!/usr/bin/perl -w
2 #
3 # This is the DX cluster 'daemon'. It sits in the middle of its little
4 # web of client routines sucking and blowing data where it may.
5 #
6 # Hence the name of 'spider' (although it may become 'dxspider')
7 #
8 # Copyright (c) 1998 Dirk Koopman G1TLH
9 #
10 # $Id$
11
12
13 require 5.004;
14
15 # make sure that modules are searched in the order local then perl
16 BEGIN {
17         umask 002;
18         
19         # root of directory tree for this system
20         $root = "/spider"; 
21         $root = $ENV{'DXSPIDER_ROOT'} if $ENV{'DXSPIDER_ROOT'};
22         
23         unshift @INC, "$root/perl";     # this IS the right way round!
24         unshift @INC, "$root/local";
25
26         # do some validation of the input
27         die "The directory $root doesn't exist, please RTFM" unless -d $root;
28         die "$root/local doesn't exist, please RTFM" unless -d "$root/local";
29         die "$root/local/DXVars.pm doesn't exist, please RTFM" unless -e "$root/local/DXVars.pm";
30         
31         mkdir "$root/local_cmd", 0777 unless -d "$root/local_cmd";
32         
33
34         # try to create and lock a lockfile (this isn't atomic but 
35         # should do for now
36         $lockfn = "$root/local/cluster.lck";       # lock file name
37         if (-e $lockfn) {
38                 open(CLLOCK, "$lockfn") or die "Can't open Lockfile ($lockfn) $!";
39                 my $pid = <CLLOCK>;
40                 chomp $pid;
41                 die "Lockfile ($lockfn) and process $pid exist, another cluster running?" if kill 0, $pid;
42                 close CLLOCK;
43         }
44         open(CLLOCK, ">$lockfn") or die "Can't open Lockfile ($lockfn) $!";
45         print CLLOCK "$$\n";
46         close CLLOCK;
47
48         $is_win = ($^O =~ /^MS/ || $^O =~ /^OS-2/) ? 1 : 0; # is it Windows?
49         $systime = time;
50 }
51
52 use DXVars;
53 use Msg;
54 use IntMsg;
55 use Internet;
56 use Listeners;
57 use ExtMsg;
58 use AGWConnect;
59 use AGWMsg;
60 use DXDebug;
61 use DXLog;
62 use DXLogPrint;
63 use DXUtil;
64 use DXChannel;
65 use DXUser;
66 use DXM;
67 use DXCommandmode;
68 use DXProtVars;
69 use DXProtout;
70 use DXProt;
71 use DXMsg;
72 use DXCron;
73 use DXConnect;
74 use DXBearing;
75 use DXDb;
76 use DXHash;
77 use DXDupe;
78 use Script;
79 use Prefix;
80 use Spot;
81 use Bands;
82 use Keps;
83 use Minimuf;
84 use Sun;
85 use Geomag;
86 use CmdAlias;
87 use Filter;
88 use AnnTalk;
89 use BBS;
90 use WCY;
91 use BadWords;
92 use Timer;
93 use Route;
94 use Route::Node;
95 use Route::User;
96 use Editable;
97 use Mrtg;
98 use USDB;
99 use UDPMsg;
100 use QSL;
101 use RouteDB;
102 use DXXml;
103 use DXSql;
104 use IsoTime;
105
106 use Data::Dumper;
107 use IO::File;
108 use Fcntl ':flock'; 
109 use POSIX ":sys_wait_h";
110
111 use Local;
112
113 package main;
114
115 use strict;
116 use vars qw(@inqueue $systime $version $starttime $lockfn @outstanding_connects 
117                         $zombies $root @listeners $lang $myalias @debug $userfn $clusteraddr 
118                         $clusterport $mycall $decease $is_win $routeroot $me $reqreg $bumpexisting
119                         $allowdxby $dbh $dsn $dbuser $dbpass $do_xml $systime_days $systime_daystart
120                    );
121
122 @inqueue = ();                                  # the main input queue, an array of hashes
123 $systime = 0;                                   # the time now (in seconds)
124 $version = "1.53";                              # the version no of the software
125 $starttime = 0;                 # the starting time of the cluster   
126 #@outstanding_connects = ();     # list of outstanding connects
127 @listeners = ();                                # list of listeners
128 $reqreg = 0;                                    # 1 = registration required, 2 = deregister people
129 $bumpexisting = 1;                              # 1 = allow new connection to disconnect old, 0 - don't allow it
130 $allowdxby = 0;                                 # 1 = allow "dx by <othercall>", 0 - don't allow it
131
132
133 use vars qw($VERSION $BRANCH $build $branch);
134 $VERSION = sprintf( "%d.%03d", q$Revision$ =~ /(\d+)\.(\d+)/ );
135 $BRANCH = sprintf( "%d.%03d", q$Revision$ =~ /\d+\.\d+\.(\d+)\.(\d+)/  || (0,0));
136 $main::build += $VERSION;
137 $main::branch += $BRANCH;
138 $main::build -= 3;                              # fudge (put back for now)
139
140
141       
142 # send a message to call on conn and disconnect
143 sub already_conn
144 {
145         my ($conn, $call, $mess) = @_;
146
147         $conn->disable_read(1);
148         dbg("-> D $call $mess\n") if isdbg('chan'); 
149         $conn->send_now("D$call|$mess");
150         sleep(2);
151         $conn->disconnect;
152 }
153
154 sub error_handler
155 {
156         my $dxchan = shift;
157         $dxchan->{conn}->set_error(undef) if exists $dxchan->{conn};
158         $dxchan->disconnect(1);
159 }
160
161 # handle incoming messages
162 sub new_channel
163 {
164         my ($conn, $msg) = @_;
165         my ($sort, $call, $line) = DXChannel::decode_input(0, $msg);
166         return unless defined $sort;
167
168         unless (is_callsign($call)) {
169                 already_conn($conn, $call, DXM::msg($lang, "illcall", $call));
170                 return;
171         }
172
173         # set up the basic channel info
174         # is there one already connected to me - locally? 
175         my $user = DXUser->get_current($call);
176         my $dxchan = DXChannel::get($call);
177         if ($dxchan) {
178                 if ($user && $user->is_node) {
179                         already_conn($conn, $call, DXM::msg($lang, 'concluster', $call, $main::mycall));
180                         return;
181                 }
182                 if ($bumpexisting) {
183                         my $ip = $conn->{peerhost} || 'unknown';
184                         $dxchan->send_now('D', DXM::msg($lang, 'conbump', $call, $ip));
185                         LogDbg('DXCommand', "$call bumped off by $ip, disconnected");
186                         $dxchan->disconnect;
187                 } else {
188                         already_conn($conn, $call, DXM::msg($lang, 'conother', $call, $main::mycall));
189                         return;
190                 }
191         }
192
193         # is he locked out ?
194         my $basecall = $call;
195         $basecall =~ s/-\d+$//;
196         my $baseuser = DXUser->get_current($basecall);
197         my $lock = $user->lockout if $user;
198         if ($baseuser && $baseuser->lockout || $lock) {
199                 if (!$user || !defined $lock || $lock) {
200                         my $host = $conn->{peerhost} || "unknown";
201                         LogDbg('DXCommand', "$call on $host is locked out, disconnected");
202                         $conn->disconnect;
203                         return;
204                 }
205         }
206         
207         if ($user) {
208                 $user->{lang} = $main::lang if !$user->{lang}; # to autoupdate old systems
209         } else {
210                 $user = DXUser->new($call);
211         }
212         
213         # create the channel
214         if ($user->is_node) {
215                 $dxchan = DXProt->new($call, $conn, $user);
216         } elsif ($user->is_user) {
217                 $dxchan = DXCommandmode->new($call, $conn, $user);
218         } elsif ($user->is_bbs) {
219                 $dxchan = BBS->new($call, $conn, $user);
220         } else {
221                 die "Invalid sort of user on $call = $sort";
222         }
223
224         # check that the conn has a callsign
225         $conn->conns($call) if $conn->isa('IntMsg');
226
227         # set callbacks
228         $conn->set_error(sub {error_handler($dxchan)});
229         $conn->set_rproc(sub {my ($conn,$msg) = @_; $dxchan->rec($msg);});
230         $dxchan->rec($msg);
231 }
232
233
234 sub login
235 {
236         return \&new_channel;
237 }
238
239 # cease running this program, close down all the connections nicely
240 sub cease
241 {
242         my $dxchan;
243
244         unless ($is_win) {
245                 $SIG{'TERM'} = 'IGNORE';
246                 $SIG{'INT'} = 'IGNORE';
247         }
248         
249         DXUser::sync;
250
251         eval {
252                 Local::finish();   # end local processing
253         };
254         dbg("Local::finish error $@") if $@;
255
256         # disconnect nodes
257         foreach $dxchan (DXChannel::get_all_nodes) {
258             $dxchan->disconnect(2) unless $dxchan == $main::me;
259         }
260         Msg->event_loop(100, 0.01);
261
262         # disconnect users
263         foreach $dxchan (DXChannel::get_all_users) {
264                 $dxchan->disconnect;
265         }
266
267         # disconnect AGW
268         AGWMsg::finish();
269
270         # disconnect UDP customers
271         UDPMsg::finish();
272
273         # end everything else
274         Msg->event_loop(100, 0.01);
275         DXUser::finish();
276         DXDupe::finish();
277
278         # close all databases
279         DXDb::closeall;
280
281         # close all listeners
282         foreach my $l (@listeners) {
283                 $l->close_server;
284         }
285
286         LogDbg('cluster', "DXSpider V$version, build $build ended");
287         dbgclose();
288         Logclose();
289
290         $dbh->finish if $dbh;
291         
292         unlink $lockfn;
293 #       $SIG{__WARN__} = $SIG{__DIE__} =  sub {my $a = shift; cluck($a); };
294         exit(0);
295 }
296
297 # the reaper of children
298 sub reap
299 {
300         my $cpid;
301         while (($cpid = waitpid(-1, WNOHANG)) > 0) {
302                 dbg("cpid: $cpid") if isdbg('reap');
303 #               Msg->pid_gone($cpid);
304                 $zombies-- if $zombies > 0;
305         }
306         dbg("cpid: $cpid") if isdbg('reap');
307 }
308
309 # this is where the input queue is dealt with and things are dispatched off to other parts of
310 # the cluster
311
312 sub uptime
313 {
314         my $t = $systime - $starttime;
315         my $days = int $t / 86400;
316         $t -= $days * 86400;
317         my $hours = int $t / 3600;
318         $t -= $hours * 3600;
319         my $mins = int $t / 60;
320         return sprintf "%d %02d:%02d", $days, $hours, $mins;
321 }
322
323 sub AGWrestart
324 {
325         AGWMsg::init(\&new_channel);
326 }
327
328 #############################################################
329 #
330 # The start of the main line of code 
331 #
332 #############################################################
333
334 $starttime = $systime = time;
335 $systime_days = int ($systime / 86400);
336 $systime_daystart = $systime_days * 86400; 
337 $lang = 'en' unless $lang;
338
339 unless ($DB::VERSION) {
340         $SIG{INT} = $SIG{TERM} = \&cease;
341 }
342
343 # open the debug file, set various FHs to be unbuffered
344 dbginit(\&DXCommandmode::broadcast_debug);
345 foreach (@debug) {
346         dbgadd($_);
347 }
348 STDOUT->autoflush(1);
349
350 # calculate build number
351 $build += $main::version;
352 $build = "$build.$branch" if $branch;
353
354 # try to load the database
355 if (DXSql::init($dsn)) {
356         $dbh = DXSql->new($dsn);
357         $dbh = $dbh->connect($dsn, $dbuser, $dbpass) if $dbh;
358 }
359
360 # try to load XML::Simple
361 DXXml::init();
362
363 # banner
364 my ($year) = (gmtime)[5];
365 $year += 1900;
366 LogDbg('cluster', "DXSpider V$version, build $build started");
367 dbg("Copyright (c) 1998-$year Dirk Koopman G1TLH");
368
369 # load Prefixes
370 dbg("loading prefixes ...");
371 dbg(USDB::init());
372 my $r = Prefix::init();
373 confess $r if $r;
374
375 # load band data
376 dbg("loading band data ...");
377 Bands::load();
378
379 # initialise User file system
380 dbg("loading user file system ..."); 
381 DXUser->init($userfn, 1);
382
383 # look for the sysop and the alias user and complain if they aren't there
384 {
385         my $ref = DXUser->get($mycall);
386         die "$mycall missing, run the create_sysop.pl script and please RTFM" unless $ref && $ref->priv == 9;
387         $ref = DXUser->get($myalias);
388         die "$myalias missing, run the create_sysop.pl script and please RTFM" unless $ref && $ref->priv == 9;
389 }
390
391 # start listening for incoming messages/connects
392 dbg("starting listeners ...");
393 my $conn = IntMsg->new_server($clusteraddr, $clusterport, \&login);
394 $conn->conns("Server $clusteraddr/$clusterport using IntMsg");
395 push @listeners, $conn;
396 dbg("Internal port: $clusteraddr $clusterport using IntMsg");
397 foreach my $l (@main::listen) {
398         no strict 'refs';
399         my $pkg = $l->[2] || 'ExtMsg';
400         my $login = $l->[3] || 'login'; 
401         
402         $conn = $pkg->new_server($l->[0], $l->[1], \&{"${pkg}::${login}"});
403         $conn->conns("Server $l->[0]/$l->[1] using ${pkg}::${login}");
404         push @listeners, $conn;
405         dbg("External Port: $l->[0] $l->[1] using ${pkg}::${login}");
406 }
407
408 dbg("AGW Listener") if $AGWMsg::enable;
409 AGWrestart();
410
411 dbg("UDP Listener") if $UDPMsg::enable;
412 UDPMsg::init(\&new_channel);
413
414 # load bad words
415 dbg("load badwords: " . (BadWords::load or "Ok"));
416
417 # prime some signals
418 unless ($DB::VERSION) {
419         $SIG{INT} = $SIG{TERM} = sub { $decease = 1 };
420 }
421
422 unless ($is_win) {
423         $SIG{HUP} = 'IGNORE';
424         $SIG{CHLD} = sub { $zombies++ };
425         
426         $SIG{PIPE} = sub {      dbg("Broken PIPE signal received"); };
427         $SIG{IO} = sub {        dbg("SIGIO received"); };
428         $SIG{WINCH} = $SIG{STOP} = $SIG{CONT} = 'IGNORE';
429         $SIG{KILL} = 'DEFAULT';     # as if it matters....
430
431         # catch the rest with a hopeful message
432         for (keys %SIG) {
433                 if (!$SIG{$_}) {
434                         #               dbg("Catching SIG $_") if isdbg('chan');
435                         $SIG{$_} = sub { my $sig = shift;       DXDebug::confess("Caught signal $sig");  }; 
436                 }
437         }
438 }
439
440 # start dupe system
441 dbg("Starting Dupe system");
442 DXDupe::init();
443
444 # read in system messages
445 dbg("Read in Messages");
446 DXM->init();
447
448 # read in command aliases
449 dbg("Read in Aliases");
450 CmdAlias->init();
451
452 # initialise the Geomagnetic data engine
453 dbg("Start WWV");
454 Geomag->init();
455 dbg("Start WCY");
456 WCY->init();
457
458 # initial the Spot stuff
459 dbg("Starting DX Spot system");
460 Spot->init();
461
462 # initialise the protocol engine
463 dbg("Start Protocol Engines ...");
464 DXProt->init();
465
466 # put in a DXCluster node for us here so we can add users and take them away
467 $routeroot = Route::Node->new($mycall, $version*100+5300, Route::here($main::me->here)|Route::conf($main::me->conf));
468
469 # make sure that there is a routing OUTPUT node default file
470 #unless (Filter::read_in('route', 'node_default', 0)) {
471 #       my $dxcc = $main::me->dxcc;
472 #       $Route::filterdef->cmd($main::me, 'route', 'accept', "node_default call $mycall" );
473 #}
474
475 # read in any existing message headers and clean out old crap
476 dbg("reading existing message headers ...");
477 DXMsg->init();
478 DXMsg::clean_old();
479
480 # read in any cron jobs
481 dbg("reading cron jobs ...");
482 DXCron->init();
483
484 # read in database descriptors
485 dbg("reading database descriptors ...");
486 DXDb::load();
487
488 # starting local stuff
489 dbg("doing local initialisation ...");
490 QSL::init(1);
491 eval {
492         Local::init();
493 };
494 dbg("Local::init error $@") if $@;
495
496 # this, such as it is, is the main loop!
497 dbg("orft we jolly well go ...");
498 my $script = new Script "startup";
499 $script->run($main::me) if $script;
500
501 #open(DB::OUT, "|tee /tmp/aa");
502
503 for (;;) {
504 #       $DB::trace = 1;
505         
506         Msg->event_loop(10, 0.010);
507         my $timenow = time;
508
509         DXChannel::process();
510         
511 #       $DB::trace = 0;
512         
513         # do timed stuff, ongoing processing happens one a second
514         if ($timenow != $systime) {
515                 reap() if $zombies;
516                 $systime = $timenow;
517                 my $days = int ($systime / 86400);
518                 if ($systime_days != $days) {
519                         $systime_days = $days;
520                         $systime_daystart = $days * 86400;
521                 }
522                 IsoTime::update($systime);
523                 DXCron::process();      # do cron jobs
524                 DXCommandmode::process(); # process ongoing command mode stuff
525                 DXXml::process();
526                 DXProt::process();              # process ongoing ak1a pcxx stuff
527                 DXConnect::process();
528                 DXMsg::process();
529                 DXDb::process();
530                 DXUser::process();
531                 DXDupe::process();
532                 AGWMsg::process();
533
534                 eval { 
535                         Local::process();       # do any localised processing
536                 };
537                 dbg("Local::process error $@") if $@;
538         }
539         if ($decease) {
540                 last if --$decease <= 0;
541         }
542 }
543 cease(0);
544 exit(0);
545
546