b28822c1fb083c59afb49ff45cf8c04a13c0cef4
[spider.git] / html / adminmanual-2.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
2 <HTML>
3 <HEAD>
4  <META NAME="GENERATOR" CONTENT="SGML-Tools 1.0.9">
5  <TITLE>The DXSpider Administration Manual v1.48: Other filters</TITLE>
6  <LINK HREF="adminmanual-3.html" REL=next>
7  <LINK HREF="adminmanual-1.html" REL=previous>
8  <LINK HREF="adminmanual.html#toc2" REL=contents>
9 <link rel=stylesheet href="style.css" type="text/css" title="default stylesheet">
10 </HEAD>
11 <BODY>
12 <A HREF="adminmanual-3.html">Next</A>
13 <A HREF="adminmanual-1.html">Previous</A>
14 <A HREF="adminmanual.html#toc2">Contents</A>
15 <HR>
16 <H2><A NAME="s2">2. Other filters</A></H2>
17
18 <H2><A NAME="ss2.1">2.1 Filtering Mail</A>
19 </H2>
20
21 <P>In the /spider/msg directory you will find a file called badmsg.pl.issue.  Rename
22 this to badmsg.pl and edit the file.  The original looks something like this ....
23 <P>
24 <BLOCKQUOTE><CODE>
25 <PRE>
26
27 # the list of regexes for messages that we won't store having
28 # received them (bear in mind that we must receive them fully before
29 # we can bin them)
30
31
32 # The format of each line is as follows
33
34 #     type      source             pattern 
35 #     P/B/F     T/F/O/S            regex  
36
37 # type: P - private, B - bulletin (msg), F - file (ak1a bull)
38 # source: T - to field, F - from field,  O - origin, S - subject 
39 # pattern: a perl regex on the field requested
40
41 # Currently only type B and P msgs are affected by this code.
42
43 # The list is read from the top down, the first pattern that matches
44 # causes the action to be taken.
45
46 # The pattern can be undef or 0 in which case it will always be selected
47 # for the action specified
48
49
50
51 package DXMsg;
52
53 @badmsg = (
54 'B',    'T',    'SALE', 
55 'B',    'T',    'WANTED',
56 'B',    'S',    'WANTED',
57 'B',    'S',    'SALE', 
58 'B',    'S',    'WTB',
59 'B',    'S',    'WTS',
60 'B',    'T',    'FS',
61 );
62 </PRE>
63 </CODE></BLOCKQUOTE>
64 <P>
65 <P>I think this is fairly self explanatory.  It is simply a list of subject 
66 headers that we do not want to pass on to either the users of the cluster or 
67 the other cluster nodes that we are linked to.  This is usually because of 
68 rules and regulations pertaining to items for sale etc in a particular country.
69 <P>
70 <H2><A NAME="ss2.2">2.2 Filtering DX callouts (Depricated)</A>
71 </H2>
72
73 <P><B><I>From version 1.47, this method is replaced by the command set/baddx</I></B>
74 <P>
75 <P>In the same way as mail, there are some types of spot we do not wish to pass on 
76 to users or linked cluster nodes.  In the /spider/data directory you will find 
77 a file called baddx.pl.issue.  Rename this to baddx.pl and edit the file.  The
78 original looks like this ....
79 <P>
80 <BLOCKQUOTE><CODE>
81 <PRE>
82
83 # the list of dx spot addresses that we don't store and don't pass on
84
85
86 package DXProt;
87
88 @baddx = qw 
89
90  FROG 
91  SALE
92  FORSALE
93  WANTED
94  P1RATE
95  PIRATE
96  TEST
97  DXTEST
98  NIL
99  NOCALL 
100 );
101 </PRE>
102 </CODE></BLOCKQUOTE>
103 <P>
104 <P>Again, this is simply a list of names we do not want to see in the spotted 
105 field of a DX callout.
106 <P>
107 <P>
108 <H2><A NAME="ss2.3">2.3 Filtering words from text fields in Announce, Talk and DX spots</A>
109 </H2>
110
111 <P>Create a file in /spider/data called <EM>badwords</EM>.  The format is quite
112 simple.  Lines beginning with # are ignored so comments can be added.  An
113 example file is below ...
114 <P>
115 <BLOCKQUOTE><CODE>
116 <PRE>
117 # Below is a list of words we do not wish to see on the cluster
118 grunge grunged grunging
119 splodge splodger splodging
120 grince
121 fluffle
122 </PRE>
123 </CODE></BLOCKQUOTE>
124 <P>Multiple words can be used on the same line as shown.  Obviously these
125 are just examples :-)
126 <P>
127 <P>You can reload the file from the cluster prompt as sysop with load/badwords.
128 <P>
129 <HR>
130 <A HREF="adminmanual-3.html">Next</A>
131 <A HREF="adminmanual-1.html">Previous</A>
132 <A HREF="adminmanual.html#toc2">Contents</A>
133 </BODY>
134 </HTML>