Gracias a la densidad de palabras (las de mayor frecuencia) las listas de bloqueo se pueden reducir hasta un 89%
Ademas consigues bloquear sitios aun no identificados en los "Sources List Hosts"; ya que muchas veces siguen usando palabras frecuentes.
"" Gracias bloqueo masivo ""
-- [notepad++ ][buscar y reemplazar]
eliminar palabra 0.0.0.0 (hay un espacio al final) por "nada"
reemplazar palabra www. por . (solo punto)
-- [notepad++ macro][buscar - busqueda incremental - "F3" siguiente]
eliminar lineas con #
-- [notepad++ ][editar - operaciones con lineas - eliminar lineas vacias y con contenido en blanco]
eliminar lineas vacias
-- [notepad++ macro][buscar - busqueda incremental - "F3" siguiente]
eliminar lineas duplicadas
-- [notepad++ macro]
agregar al final de la linea /
-- [notepad++ ][buscar y reemplazar] (no guardar los cambios)
cambiar (punto) . por iii iii (hay un espacio entre ellas)
cambiar - por aaa
cambiar _ por eee
cambiar / por ooo
-- pegar en [character-counter.com] para que calcule la densidad de palabras
-- [notepad++ ][buscar y reemplazar] copiar densidad de palabras y deshacer cambios
cambiar iii por . (punto)
cambiar aaa por -
cambiar eee por _
cambiar ooo por / (/ y espacio)
-- palabras largas son las mejores (mas de 5 caracteres).
-- palabra demasiado corta generalmente da problemas; se pueden probar así pero es posible que afectan a demasiadas paginas
-- lo mejor es añadirles mas elementos en [notepad++] se pueden visualizar para afinar la cacería.
[notepad++] [buscar - buscar - buscar solo en el archivo actual]
Ejemplo de resultado obtenido del file hosts
https://github.com/StevenBlack/hosts
Extending and consolidating hosts files from a variety of sources like adaway.org, mvps.org, malwaredomains.com, someonewhocares.org, yoyo.org, and potentially others.
Usando comodines se eliminar varios renglones del file hosts original.
Notese que la palabra 2o7 tiene una alta frecuencia (1299) revisado en el file host original se observa que se puede acompletar con:
2o7.net/ y .2o7.net/ (esto equivale a 1299 lineas del Hosts file, :,o)
De la misma manera se sigue con el resto de las palabras enlistadas. (imagen inferior)
Word |Freq |Freq (%)
.com/ .|2616 |4.1
.2o7. |1299 |2.0
.com/ ads.|1051 |1.7
.112. |966 |1.5
.intellitxt.|804 |1.3
.us. |683 |1.1
.co. |490 |0.8
.com. |380 |0.6
.hitbox.|364 |0.6
.122. |332 |0.5
.net/ .|277 |0.4
.com/ ad.|232 |0.4
.com/ track.|220 |0.3
.2mdn.|215 |0.3
.com/ oascentral.|205 |0.3
.adtech.|203 |0.3
.hit. |203 |0.3
.p2l. |198 |0.3
.com/ adserver.|183 |0.3
.com/ cdn.|181 |0.3
.com/ metrics.|176 |0.3
.gemius.|175 |0.3
.doubleclick.|160 |0.3
.net/ ads.|148 |0.2
.pl/ .|131 |0.2
.oewabox.|126 |0.2
.blogspot.|124 |0.2
.smaato.|120 |0.2
.am15.|120 |0.2
.com/ banners.|119 |0.2
etc . . . . . .
Que se diviertan . . . . . :,D