martes, 27 de diciembre de 2016

PRIVOXY CALCULAR DENSIDAD DE PALABRAS

PRIVOXY CALCULAR DENSIDAD DE PALABRAS ...........................................................
Gracias a la densidad de palabras (las de mayor frecuencia) las listas de bloqueo se pueden reducir hasta un 89%
Ademas consigues bloquear sitios aun no identificados en los "Sources List Hosts"; ya que muchas veces siguen usando palabras frecuentes.
"" Gracias bloqueo masivo ""

-- [notepad++ ][buscar y reemplazar]
eliminar palabra  0.0.0.0 (hay un espacio al final)  por "nada"
reemplazar palabra  www.  por  . (solo punto)
-- [notepad++ macro][buscar - busqueda incremental - "F3" siguiente]
eliminar lineas con  #
-- [notepad++ ][editar - operaciones con lineas - eliminar lineas vacias y con contenido en blanco]
eliminar lineas vacias
-- [notepad++ macro][buscar - busqueda incremental - "F3" siguiente]
eliminar lineas duplicadas
-- [notepad++ macro]
agregar al final de la linea     /
-- [notepad++ ][buscar y reemplazar]  (no guardar los cambios)
cambiar (punto)  .  por    iii iii (hay un espacio entre ellas)
cambiar  -  por  aaa
cambiar  _  por eee
cambiar  /  por  ooo
-- pegar en    [character-counter.com]   para que calcule la densidad de palabras
-- [notepad++ ][buscar y reemplazar] copiar densidad de palabras y deshacer cambios
cambiar   iii por  .  (punto)
cambiar  aaa  por   -
cambiar  eee  por   _
cambiar  ooo  por   /     (/ y espacio)
-- palabras largas son las mejores (mas de 5 caracteres).
-- palabra demasiado corta generalmente da problemas; se pueden probar así pero es posible que afectan a demasiadas paginas
-- lo mejor es añadirles mas elementos en  [notepad++] se pueden visualizar para afinar la cacería.
 [notepad++] [buscar - buscar - buscar solo en el archivo actual]

.....................................................................................................................................

Ejemplo de resultado obtenido del file hosts
https://github.com/StevenBlack/hosts
Extending and consolidating hosts files from a variety of sources like adaway.org, mvps.org, malwaredomains.com, someonewhocares.org, yoyo.org, and potentially others.

Usando comodines se eliminar varios renglones del file hosts original.
Notese que la palabra   2o7    tiene una alta frecuencia (1299) revisado en el file host original se observa que se puede acompletar con:
    2o7.net/   y  .2o7.net/    (esto equivale a 1299 lineas del Hosts file, :,o)
De la misma manera se sigue con el resto de las palabras enlistadas. (imagen inferior)

Word      |Freq |Freq (%)
.com/ .|2616 |4.1
.2o7. |1299 |2.0
.com/ ads.|1051 |1.7
.112. |966 |1.5
.intellitxt.|804 |1.3
.us.  |683 |1.1
.co.  |490 |0.8
.com. |380 |0.6
.hitbox.|364 |0.6
.122. |332 |0.5
.net/ .|277 |0.4
.com/ ad.|232 |0.4
.com/ track.|220 |0.3
.2mdn.|215 |0.3
.com/ oascentral.|205 |0.3
.adtech.|203 |0.3
.hit. |203 |0.3
.p2l. |198 |0.3
.com/ adserver.|183 |0.3
.com/ cdn.|181 |0.3
.com/ metrics.|176 |0.3
.gemius.|175 |0.3
.doubleclick.|160 |0.3
.net/ ads.|148 |0.2
.pl/ .|131 |0.2
.oewabox.|126 |0.2
.blogspot.|124 |0.2
.smaato.|120 |0.2
.am15.|120 |0.2
.com/ banners.|119 |0.2
etc . . . . . .




Que se diviertan . . . . . :,D

No hay comentarios.:

Publicar un comentario