sábado, 28 de julio de 2018

PRIVOXY - DENSIDAD DE PALABRAS

PRIVOXY - DENSIDAD DE PALABRAS

Anteriormente ya he hablado de esto en el uso de determinacion de Wild Cards en Privoxy . . .
ahora es solo para mensionar estos metodos que he utilizado . . .


----------------------------------------------------------------
Determinando densidad de palabras . . . con powershell . . . muy lento . . .
----------------------------------------------------------------

$contents = ( Get-Content "StevenBlackhosts-original.txt" | Select-Object -Skip 30 | Foreach-Object {$_ -Replace('^0.0.0.0 ', '')} | Where-Object {$_ -notmatch '#'} | ? {$_.trim() -ne "" } | foreach { $_ + '/' } )
$words = $contents.split(" .,?()") | Where-Object {$_} # this removes any empties/spaces
($words | Group-Object | Sort-Object -Property Count -Descending | Format-Table name,count -auto ) | select -First 1000 | Out-File "StevenBlackhosts-dp1.txt"



----------------------------------------------------------------
Determinando densidad de palabras . . . con https://www.online-utility.org/text/analyzer.jsp . . . mas rapido . . . 
----------------------------------------------------------------
- Antes una pequeña adaptacion . . . 

Get-Content "StevenBlackhosts-original.txt" | Select-Object -Skip 30 | Foreach-Object {$_ -Replace('^0.0.0.0 ', '')} | Where-Object {$_ -notmatch '#'} | ? {$_.trim() -ne "" } | foreach { $_ + '/' } | Set-Content "SBH-dp0.txt"

copiar y pegar a   https://www.online-utility.org/text/analyzer.jsp

localizar ..::  Unfiltered word count:
copiar y pegar en notepaq++ .. .. Dejar hasta "Order" 

----------------------------------------------------------------
Powershell  --  VS  --  https://www.online-utility.org/text/analyzer.jsp
----------------------------------------------------------------
En la imagen inferior una pequeña confrontacion entre ambos metodos . . . resultados siimilares ... muy recomendables . . . FELIZ  CAZERIA ... XD

XD

No hay comentarios.:

Publicar un comentario