{"id":709,"date":"2006-01-14T19:10:11","date_gmt":"2006-01-14T19:10:11","guid":{"rendered":"http:\/\/junjan.org\/wordpress\/?p=709"},"modified":"2006-01-14T19:10:11","modified_gmt":"2006-01-14T19:10:11","slug":"spamlookup","status":"publish","type":"post","link":"https:\/\/junjan.org\/wordpress\/2006\/01\/spamlookup\/","title":{"rendered":"SpamLookup"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" alt=\"Spam_closeup.png\" title=\"Spam a Go-Go\" src=\"http:\/\/www.junjan.org\/weblog\/images\/Spam_closeup.png\" width=\"362\" height=\"238\" border=\"1\" \/><br \/>\nEl Spam que llega a un blog es realmente impresionante, por ejemplo, <strong>en las \u00faltimas cuatro horas han llegado a \u00abLa Opini\u00f3n Alternativa\u00bb 200 intentos de Spam.<\/strong>  Estos 200 mensajes fallidos se compon\u00edan de publicidad de casinos online, medicamentos variados, tonos para tel\u00e9fonos m\u00f3viles, pr\u00e9stamos, \u00abescaleras para perros\u00bb:http:\/\/doggysteps.com\/ (\u00a1Si como lo o\u00eds!) y los que simplemente buscan que pongas en tu lista negra a Google o Yahoo sin darte cuenta. Apasionante.<br \/>\n\u00abMovableType 3.2\u00bb:http:\/\/www.sixapart.com\/movabletype\/ se defiende del \u00abSpam\u00bb:http:\/\/es.wikipedia.org\/wiki\/SPAM con un m\u00f3dulo llamado [\u00abSpamLookup\u00bb:http:\/\/bradchoate.com\/projects\/spamlookup\/]. Este m\u00f3dulo filtra los comentarios y los elimina si detecta alguna caracter\u00edstica de Spam:<br \/>\n&#8211; Si la direcci\u00f3n IP se encuentra en su \u00ablista negra\u00bb de Spammers conocidos.<br \/>\n&#8211; Si tiene un n\u00famero de enlaces superior al indicado por m\u00ed.<br \/>\n&#8211; Si encuentra en su contendio alguna palabra o expresi\u00f3n que yo haya previamente indicado como Spam.<br \/>\nPor ejemplo alguna de las siguientes:<\/p>\n<blockquote><p>4u adipex advicer baccarrat blackjack booker byob car-rental-e-site car-rentals-e-site carisoprodol casino casinos chatroom celebrex cialis credit-report-4u cwas cyclen cyclobenzaprine dating-e-site day-trading debt-consolidation-consultant discreetordering duty-free dutyfree equityloans fioricet flowers-leading-site freenet-shopping gambling health-insurancedeals-4u homeequityloans homefinance holdem holdempoker holdemsoftware holdemtexasturbowilson hotel-dealse-site hotele-site hotelse-site incest insurance-quotesdeals-4u insurancedeals-4u jrcreations kasino levitra loan macinstruct mortgage-4-u mortgagequotes online-gambling onlinegambling-4u ottawavalleyag ownsthis palm-texas-holdem-game paxil penis pharmacy phentermine poker poker-chip poze rental-car-e-site roulette shemale shoes slot-machine slot taboo teen texas-holdem thorcarlson top-site top-e-site tramadol trim-spa ultram valeofglamorganconservatives viagra vioxx xanax zolus zyban\n<\/p><\/blockquote>\n<p>Aunque pudiera parecer que este m\u00f3dulo es una parte esencial del funcionamiento de Movable Type, la documentaci\u00f3n al respecto casi brilla por su ausencia. \u00bfC\u00f3mo se hace un \u00abregex\u00bb:http:\/\/es.wikipedia.org\/wiki\/Expresi%C3%B3n_regular que permita buscar muchas palabras autom\u00e1ticamente? \u00bfQu\u00e9 trucos permiten detectar a Spammers listos que camuflan sus intenciones? Tras pasarme bastantes ratos buscando informaci\u00f3n al respecto, me parace una buena idea recopilar aqu\u00ed los tres sitios donde pude encontrar informaci\u00f3n aceptable sobre el tema.<br \/>\n\u00ac  \u00abMaking the most of SpamLookup\u00bb:http:\/\/www.neilturner.me.uk\/2005\/Sep\/10\/making_the_most_of_spamlo.html<br \/>\nCompleta explicaci\u00f3n del funcionamiento de SpamLookup. Recomendaciones y trucos.<br \/>\n\u00ac \u00abSpamLookup&#8217;s Keyword Filter Explained\u00bb:http:\/\/tweezersedge.com\/archives\/2005\/09\/000601.html<br \/>\nAqu\u00ed se explica como usar y configurar expresiones en perl que permitan buscar las palabras clave dentro de URLs. Para una mejor comprensi\u00f3n de las expresiones en perl, ver: [\u00abRegular expressions in Perl\u00bb:http:\/\/www.cs.tut.fi\/~jkorpela\/perl\/regexp.html].<br \/>\nPor ejemplo, estas son las m\u00edas.<\/p>\n<pre>\n# Patterns are Perl regular expressions.\n\/<h\/i 2\n\/poker\/i 4\n\/casino\/i 4\n\/blackjack\/i 4\n\/acroduke\/i 4\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:online|poker|casino)[^\\s\\'\"<>]*\/i 2\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:blackjack|roulette|slots|backgammon|craps|gambling)[^\\s\\'\"<>]*\/i 2\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:texas[\\w\\-_.]*hold[\\w\\-_.]*em)[^\\s\\'\"<>]*\/i 2\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:ringtone|loan|buy|funds)[^\\s\\'\"<>]*\/i 2\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:viagra|prozac|forex|zyban|pharmacy)[^\\s\\'\"<>]*\/i 2\n\/https?:\\\/\\\/[^\\s\\'\"<>]*(?:doggie|doggy|staircase|doggieramp|carpeted|steps)[^\\s\\'\"<>]*\/i 2\n\/-?itsok\/i 2\n<\/pre>\n<p>\u00ac \u00abPong Prevention and the Mysteries of Movable Type Spam\u00bb:http:\/\/www.conservativecat.com\/mt\/archives\/2005\/10\/pong_prevention_1.html<br \/>\nOtra buena explicaci\u00f3n que nos indica c\u00f3mo eliminar Trackbacks duplicados.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El Spam que llega a un blog es realmente impresionante, por ejemplo, en las \u00faltimas cuatro horas han llegado a \u00abLa Opini\u00f3n Alternativa\u00bb 200 intentos de Spam. Estos 200 mensajes fallidos se compon\u00edan de publicidad de casinos online, medicamentos variados, tonos para tel\u00e9fonos m\u00f3viles, pr\u00e9stamos, \u00abescaleras para perros\u00bb:http:\/\/doggysteps.com\/ (\u00a1Si como lo o\u00eds!) y los que&hellip;&nbsp;<a href=\"https:\/\/junjan.org\/wordpress\/2006\/01\/spamlookup\/\" rel=\"bookmark\">Leer m\u00e1s &raquo;<span class=\"screen-reader-text\">SpamLookup<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"neve_meta_sidebar":"","neve_meta_container":"","neve_meta_enable_content_width":"","neve_meta_content_width":0,"neve_meta_title_alignment":"","neve_meta_author_avatar":"","neve_post_elements_order":"","neve_meta_disable_header":"","neve_meta_disable_footer":"","neve_meta_disable_title":"","footnotes":""},"categories":[3],"tags":[146],"class_list":["post-709","post","type-post","status-publish","format-standard","hentry","category-info","tag-spam-spamlookup-movable-type-3-2-keyword-filter-filtro-palabras-regex-perl-blog-weblogs"],"_links":{"self":[{"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/posts\/709","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/comments?post=709"}],"version-history":[{"count":0,"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/posts\/709\/revisions"}],"wp:attachment":[{"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/media?parent=709"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/categories?post=709"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/junjan.org\/wordpress\/wp-json\/wp\/v2\/tags?post=709"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}