fix ann filtering
[spider.git] / perl / AnnTalk.pm
index 77f80fe29bc8c2308495d7405455f294efbdd55b..982e9c49afc9eb99b679ac180ecbdab8a48af0a4 100644 (file)
@@ -49,9 +49,10 @@ sub dup
 
        chomp $text;
        unpad($text);
-       $text =~ s/[\\\%]\d+//g;
-       $text =~ s/[^a-zA-Z0-9]//g;
+       $text =~ s/\%([0-9A-F][0-9A-F])/chr(hex($1))/eg;
        $text = substr($text, 0, $duplth) if length $text > $duplth; 
+       $text = pack("C*", map {$_ & 127} unpack("C*", $text));
+       $text =~ s/[^a-zA-Z0-9]//g;
        my $dupkey = "A$to|\L$text";
        return DXDupe::check($dupkey, $main::systime + $dupage);
 }