ravpagelinks
v1.0.31
Published
🕷️ Ferramenta básica de Enumeração de URLs em Páginas Web.
Maintainers
Readme
🚀 RavPageLinks
🕷️ Ferramenta básica de Enumeração de URLs em Páginas Web
Biblioteca NPM + CLI para extração de URLs automática de páginas

📞 Suporte
Se precisar de ajuda ou quiser falar com a equipe, entre no nosso servidor de suporte:
📋 Índice
- 🎯 Visão Geral
- 📦 Instalação Rápida
- 🛠️ Como Usar
- 🎛️ Opções da CLI
- 🔧 Filtros Avançados
- 📊 Métodos de Extração
- 🚀 Exemplos Práticos
- 🔍 Estrutura Técnica
- 🐛 Solução de Problemas
🎯 Visão Geral
O RavPageLinks é uma ferramenta básica de enumeração de URLs que combina extração HTML tradicional com renderização completa de JavaScript usando Playwright.
✨ Características Principais
- 🌐 Extração Híbrida: HTML tradicional + renderização JavaScript
- 🎯 Filtros Inteligentes: Domínio, regex e arquivos personalizados
- 📊 Logs Detalhados: Console colorido + arquivos de log
- 🚀 Performance Otimizada: Timeouts configuráveis e fallbacks
- 🔒 Validação Robusta: URLs validadas e normalizadas
📦 Instalação Rápida
# Instalar globalmente
npm i -g ravpagelinks # ✅ Recomendado
npm install -g ravpagelinks # ✅ Completo
# Ou usar diretamente com npx
npx ravpagelinks https://secguide.pages.dev/ferramentas
# Instalar navegador do Playwright
npx ravpagelinks --dw-nav🗑️ DESINSTALAR GLOBALMENTE
npm un -g ravpagelinks # ✅ Recomendado
npm uninstall -g ravpagelinks # ✅ Completo
npm remove -g ravpagelinks # ✅ Alternativo🛠️ Como Usar
Uso Básico
# Extração básica
ravpagelinks https://secguide.pages.dev/ferramentas
# Com logging detalhado no terminal
ravpagelinks https://secguide.pages.dev/ferramentas -v
# Salvar em diretório específico
ravpagelinks https://secguide.pages.dev/ferramentas -o resultadosEstrutura de Saída
📁 resultados/
└── 📁 exemplo_com/
├── 📄 links_home.txt
├── 📄 links_sobre.txt
└── 📄 links_contato.txt🎛️ Opções da CLI
| Opção | Atalho | Descrição | Padrão |
|-------|---------|-----------|---------|
| --output | -o | 📁 Diretório de saída | results |
| --filter | -f | 🔍 Filtro por domínio/regex | - |
| --filter-file | - | 📄 Arquivo de filtros | filtros.txt |
| --filter-type | - | 🎯 Tipo de filtro | file |
| --unique | -u | ✨ Remover duplicatas | false |
| --verbose | -v | 📢 Log detalhado | false |
| --enable-logs | - | 📝 Logs em arquivo | false |
| --timeout | - | ⏰ Timeout (ms) | 30000 |
| --no-playwright | - | 🚫 Desativar Playwright | false |
| --headless | - | 🌙 Navegador headless | true |
| --wait-time | - | ⏳ Espera JS (ms) | 5000 |
| --scroll | - | 📜 Rolagem automática | false |
| --browser | - | 🌐 Navegador | chromium |
🔧 Filtros Avançados
📄 Arquivo de Filtros (filtros.txt)
# 🎯 Arquivo de Filtros de RavPageLinks
# Formato: um filtro por linha
# Domínios
google.com
github.com
# Caminhos
/admin
/api/v1
# Regex
^https://.*\\.com$
/api/[a-z]+/v[0-9]
# Substrings
login
dashboardTipos de Filtro
- 🏷️ Domínio: Filtra por nome de domínio
- 🔍 Regex: Filtro por expressão regular
- 📄 Arquivo: Múltiplos filtros em arquivo
- 🔤 Substring: Busca textual simples
📊 Métodos de Extração
1. 🏗️ Extração HTML Tradicional
- Velocidade: ⭐⭐⭐⭐⭐
- JavaScript: ❌ Não renderiza
- Uso:
--no-playwright
2. 🌐 Playwright com Renderização
- Velocidade: ⭐⭐⭐
- JavaScript: ✅ Renderiza completo
- Recursos: Scroll, wait...
🔄 Fallback Automático
Se o Playwright falhar, automaticamente usa extração HTML tradicional.
🚀 Exemplos Práticos
1. Reconhecimento Básico
ravpagelinks https://secguide.pages.dev/ferramentas -v -o recon2. Filtro por Domínio
ravpagelinks https://secguide.pages.dev/ferramentas -f secguide.pages.dev --unique3. Extração com JavaScript
ravpagelinks https://secguide.pages.dev/ferramentas --scroll --wait-time 100004. Filtros Complexos
ravpagelinks https://secguide.pages.dev/ferramentas --filter-file meus_filtros.txt --filter-type regex5. Performance Crítica
ravpagelinks https://secguide.pages.dev/ferramentas --no-playwright --timeout 150006. Logs Completos
ravpagelinks https://secguide.pages.dev/ferramentas --verbose --enable-logs🔍 Estrutura Técnica
🏗️ Arquitetura do Sistema
📁 ravpagelinks/
├── 📦 package.json
├── 📖 README.md
├── 🏠 index.js
├── 🛠️ scripts/
│ └── 📜 postinstall.js
├── ⚡ bin/
│ └── 🖥️ cli.js
├── 📄 filtros.txt
├── 📄 .android-platform # gerado automaticamente
└── 📁 src/
├── 🎯 core/
│ ├── 🕷️ Crawler.js
│ ├── 🌐 URLExtractor.js
│ └── 🚀 PlaywrightCrawler.js
└── 🛠️ lib/
├── 🎛️ filters/
│ ├── 🌐 DomainFilter.js
│ ├── 🔍 RegexFilter.js
│ └── ⚙️ FilterManager.js
└── 🔧 utils/
├── 📁 FileHandler.js
├── ✅ URLValidator.js
├── 📝 AdvancedLogger.js
└── 📝 Logger.js🔄 Fluxo de Processamento
- 📥 Entrada: URL + opções
- 🌐 Crawling: HTML ou Playwright
- 🔍 Extração: URLs do conteúdo
- 🎯 Filtragem: Aplicação de filtros
- 💾 Saída: Arquivos organizados
🐛 Solução de Problemas
❌ Erros Comuns
Playwright não inicializa
- Verifique:
npx playwright install - Alternative: Use
--no-playwright
- Verifique:
Timeout em sites lentos
- Aumente:
--timeout 60000 - Ajuste:
--wait-time 10000
- Aumente:
Muitas URLs duplicadas
- Use:
--uniqueou-u
- Use:
Filtros não funcionando
- Verifique sintaxe do
filtros.txt - Use
--verbosepara debug
- Verifique sintaxe do
🔧 Dicas de Performance
- Sites estáticos: Use
--no-playwright - SPA/React: Use
--scroll --wait-time 10000 - Grandes sites: Aumente
--timeout - Debug: Use
--verbosee cheque logs
📊 Otimização de Resultados
- Combine filtros no arquivo
filtros.txt - Use
--uniquepara limpar duplicatas - Ajuste timeouts conforme a rede
- Experimente métodos de extração diferentes
🛠️ Desenvolvimento
# Clonar e desenvolver
git clone https://github.com/ravenastar-js/ravpagelinks.git
cd ravpagelinks
npm install
npm run dev