new adminmanual
[spider.git] / html / adminmanual-7.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
2 <HTML>
3 <HEAD>
4  <META NAME="GENERATOR" CONTENT="SGML-Tools 1.0.9">
5  <TITLE>The DXSpider Installation and Administration Manual : Other filters</TITLE>
6  <LINK HREF="adminmanual-8.html" REL=next>
7  <LINK HREF="adminmanual-6.html" REL=previous>
8  <LINK HREF="adminmanual.html#toc7" REL=contents>
9 </HEAD>
10 <BODY>
11 <A HREF="adminmanual-8.html">Next</A>
12 <A HREF="adminmanual-6.html">Previous</A>
13 <A HREF="adminmanual.html#toc7">Contents</A>
14 <HR>
15 <H2><A NAME="s7">7. Other filters</A></H2>
16
17 <H2><A NAME="ss7.1">7.1 Filtering Mail</A>
18 </H2>
19
20 <P>In the /spider/msg directory you will find a file called badmsg.pl.issue.  Rename
21 this to badmsg.pl and edit the file.  The original looks something like this ....
22 <P>
23 <BLOCKQUOTE><CODE>
24 <PRE>
25
26 # the list of regexes for messages that we won't store having
27 # received them (bear in mind that we must receive them fully before
28 # we can bin them)
29
30
31 # The format of each line is as follows
32
33 #     type      source             pattern 
34 #     P/B/F     T/F/O/S            regex  
35
36 # type: P - private, B - bulletin (msg), F - file (ak1a bull)
37 # source: T - to field, F - from field,  O - origin, S - subject 
38 # pattern: a perl regex on the field requested
39
40 # Currently only type B and P msgs are affected by this code.
41
42 # The list is read from the top down, the first pattern that matches
43 # causes the action to be taken.
44
45 # The pattern can be undef or 0 in which case it will always be selected
46 # for the action specified
47
48
49
50 package DXMsg;
51
52 @badmsg = (
53 'B',    'T',    'SALE', 
54 'B',    'T',    'WANTED',
55 'B',    'S',    'WANTED',
56 'B',    'S',    'SALE', 
57 'B',    'S',    'WTB',
58 'B',    'S',    'WTS',
59 'B',    'T',    'FS',
60 );
61 </PRE>
62 </CODE></BLOCKQUOTE>
63 <P>
64 <P>I think this is fairly self explanatory.  It is simply a list of subject 
65 headers that we do not want to pass on to either the users of the cluster or 
66 the other cluster nodes that we are linked to.  This is usually because of 
67 rules and regulations pertaining to items for sale etc in a particular country.
68 <P>
69 <H2><A NAME="ss7.2">7.2 Filtering DX callouts</A>
70 </H2>
71
72 <P>In the same way as mail, there are some types of spot we do not wish to pass on 
73 to users or linked cluster nodes.  In the /spider/data directory you will find 
74 a file called baddx.pl.issue.  Rename this to baddx.pl and edit the file.  The
75 original looks like this ....
76 <P>
77 <BLOCKQUOTE><CODE>
78 <PRE>
79
80 # the list of dx spot addresses that we don't store and don't pass on
81
82
83 package DXProt;
84
85 @baddx = qw 
86
87  FROG 
88  SALE
89  FORSALE
90  WANTED
91  P1RATE
92  PIRATE
93  TEST
94  DXTEST
95  NIL
96  NOCALL 
97 );
98 </PRE>
99 </CODE></BLOCKQUOTE>
100 <P>
101 <P>Again, this is simply a list of names we do not want to see in the spotted 
102 field of a DX callout.
103 <P>
104 <P>
105 <H2><A NAME="ss7.3">7.3 Filtering words from text fields in Announce, Talk and DX spots</A>
106 </H2>
107
108 <P>Create a file in /spider/data called <EM>badwords</EM>.  The format is quite
109 simple.  Lines beginning with # are ignored so comments can be added.  An
110 example file is below ...
111 <P>
112 <BLOCKQUOTE><CODE>
113 <PRE>
114 # Below is a list of words we do not wish to see on the cluster
115 grunge grunged grunging
116 splodge splodger splodging
117 grince
118 fluffle
119 </PRE>
120 </CODE></BLOCKQUOTE>
121 <P>Multiple words can be used on the same line as shown.  Obviously these
122 are just examples :-)
123 <P>
124 <P>You can reload the file from the cluster prompt as sysop with load/badwords.
125 <P>
126 <HR>
127 <A HREF="adminmanual-8.html">Next</A>
128 <A HREF="adminmanual-6.html">Previous</A>
129 <A HREF="adminmanual.html#toc7">Contents</A>
130 </BODY>
131 </HTML>