Mostrando estatísticas do Apache Nutch
De Basef
Para mostrar estatísticas de uma busca:
bin/nutch readdb diretorio_busca/crawldb/ -stats
Um resultado parecido com o abaixo será exibido:
CrawlDb statistics start: crawl/crawldb/
Statistics for CrawlDb: crawl/crawldb/
TOTAL urls: 30
retry 0: 30
min score: 0.001
avg score: 0.0772
max score: 1.653
status 1 (db_unfetched): 19
status 2 (db_fetched): 11
CrawlDb statistics: done