n8n-nodes-rckflr-imagetotext
v0.1.3
Published
N8N node for generating image captions using Transformer.js
Downloads
34
Maintainers
Readme
n8n Nó: Imagem para Texto (Legenda)
Este é um nó da comunidade para o n8n que permite gerar uma descrição textual (legenda) para uma determinada imagem. Ele aproveita o poder da biblioteca Transformers.js do Hugging Face para executar modelos de IA de última geração diretamente no seu fluxo de trabalho do n8n, sem a necessidade de APIs externas.
O nó pode processar imagens a partir de uma URL ou de dados binários passados por um nó anterior.
Instalação
- Vá para Configurações > Nós da Comunidade (Settings > Community Nodes) na sua instância do n8n.
- Selecione Instalar um nó da comunidade (Install a community node).
- Digite
n8n-nodes-rckflr-imagetotextna caixa de pesquisa. - Clique em Instalar.
Após a instalação, o nó "Imagem para Texto (Legenda)" estará disponível no painel de nós.
Nota de Desempenho
Como este nó executa o modelo de IA localmente na máquina onde o n8n está instalado, o desempenho pode variar significativamente com base nos recursos de hardware disponíveis (CPU, RAM). O download inicial do modelo e o tempo de geração da legenda serão mais rápidos em máquinas mais potentes.
Uso
O nó recebe uma imagem como entrada e retorna a legenda gerada no campo caption da saída JSON.
Entrada
- Entrada de Imagem (Image Input): Este campo aceita:
- Uma URL pública de uma imagem (ex.,
https://example.com/image.jpg). - O nome da propriedade binária de um nó anterior. Por exemplo, se um nó
Ler Arquivo Binário(Read Binary File) gerar dados em uma propriedade chamadadata, você usaria uma expressão e digitariadataneste campo.
- Uma URL pública de uma imagem (ex.,
Parâmetros
- Modelo (Model): Escolha o modelo de legendagem de imagem a ser usado.
ViT-GPT2 Image Captioning (Default): Um modelo robusto de propósito geral.BLIP Image Captioning (Base): Um modelo mais moderno e frequentemente mais preciso.BLIP Image Captioning (Large): Uma versão maior do BLIP para resultados potencialmente melhores, com um custo no desempenho.
- Campo de Saída da Legenda (Output Caption Field): O nome do campo onde a legenda gerada será armazenada. O padrão é
caption. - Máximo de Novos Tokens (Max New Tokens): (Opcional) Controla o comprimento máximo da legenda gerada. O padrão é
50. - Incluir Saída Completa (Include Full Output): (Opcional) Se ativado, inclui a saída completa e bruta do modelo em um campo chamado
[Nome do Campo de Saída]_full.
Exemplo de Saída
Se o Campo de Saída da Legenda estiver definido como caption, a saída será assim:
{
"caption": "um gato está sentado em um sofá",
"outro_campo_de_entrada": "algum_valor"
}Fluxo de Trabalho de Exemplo
Aqui está um exemplo básico de um fluxo de trabalho que lê uma imagem de uma URL и gera uma legenda.
{
"nodes": [
{
"parameters": {},
"name": "Start",
"type": "n8n-nodes-base.start",
"typeVersion": 1,
"position": [
250,
300
]
},
{
"parameters": {
"imageInput": "https://huggingface.co/datasets/Narsil/image_dummy/raw/main/parrots.png",
"model": "Xenova/vit-gpt2-image-captioning",
"outputFieldName": "image_caption"
},
"name": "Image to Text",
"type": "imageToTextCaptioning",
"typeVersion": 1,
"position": [
450,
300
],
"credentials": {}
}
],
"connections": {
"Start": {
"main": [
[
{
"node": "Image to Text",
"type": "main",
"index": 0
}
]
]
}
}
}Para usar este fluxo de trabalho, copie o JSON e cole na sua tela do n8n.
Compatibilidade
- Requer n8n versão 1.0 ou superior.
- Requer Node.js versão 20.15 ou superior.
