Anteriormente ya he hablado de esto en el uso de determinacion de Wild Cards en Privoxy . . .
ahora es solo para mensionar estos metodos que he utilizado . . .
----------------------------------------------------------------
Determinando densidad de palabras . . . con powershell . . . muy lento . . .
----------------------------------------------------------------
$contents = ( Get-Content "StevenBlackhosts-original.txt" | Select-Object -Skip 30 | Foreach-Object {$_ -Replace('^0.0.0.0 ', '')} | Where-Object {$_ -notmatch '#'} | ? {$_.trim() -ne "" } | foreach { $_ + '/' } )
$words = $contents.split(" .,?()") | Where-Object {$_} # this removes any empties/spaces
($words | Group-Object | Sort-Object -Property Count -Descending | Format-Table name,count -auto ) | select -First 1000 | Out-File "StevenBlackhosts-dp1.txt"
----------------------------------------------------------------
Determinando densidad de palabras . . . con https://www.online-utility.org/text/analyzer.jsp . . . mas rapido . . .
----------------------------------------------------------------
- Antes una pequeña adaptacion . . .
Get-Content "StevenBlackhosts-original.txt" | Select-Object -Skip 30 | Foreach-Object {$_ -Replace('^0.0.0.0 ', '')} | Where-Object {$_ -notmatch '#'} | ? {$_.trim() -ne "" } | foreach { $_ + '/' } | Set-Content "SBH-dp0.txt"
copiar y pegar a https://www.online-utility.org/text/analyzer.jsp
localizar ..:: Unfiltered word count:
copiar y pegar en notepaq++ .. .. Dejar hasta "Order"
----------------------------------------------------------------
Powershell -- VS -- https://www.online-utility.org/text/analyzer.jsp
----------------------------------------------------------------
En la imagen inferior una pequeña confrontacion entre ambos metodos . . . resultados siimilares ... muy recomendables . . . FELIZ CAZERIA ... XD
XD
No hay comentarios.:
Publicar un comentario