n8n-nodes-rckflr-imagetotext

v0.1.3

Published

10 months ago

N8N node for generating image captions using Transformer.js

Downloads

0High
0Medium
0Low

rckflr

n8n-community-node-package image-to-text captioning transformers ai rckflr

n8n Nó: Imagem para Texto (Legenda)

Este é um nó da comunidade para o n8n que permite gerar uma descrição textual (legenda) para uma determinada imagem. Ele aproveita o poder da biblioteca Transformers.js do Hugging Face para executar modelos de IA de última geração diretamente no seu fluxo de trabalho do n8n, sem a necessidade de APIs externas.

O nó pode processar imagens a partir de uma URL ou de dados binários passados por um nó anterior.

Instalação

Vá para Configurações > Nós da Comunidade (Settings > Community Nodes) na sua instância do n8n.
Selecione Instalar um nó da comunidade (Install a community node).
Digite n8n-nodes-rckflr-imagetotext na caixa de pesquisa.
Clique em Instalar.

Após a instalação, o nó "Imagem para Texto (Legenda)" estará disponível no painel de nós.

Nota de Desempenho

Como este nó executa o modelo de IA localmente na máquina onde o n8n está instalado, o desempenho pode variar significativamente com base nos recursos de hardware disponíveis (CPU, RAM). O download inicial do modelo e o tempo de geração da legenda serão mais rápidos em máquinas mais potentes.

Uso

O nó recebe uma imagem como entrada e retorna a legenda gerada no campo caption da saída JSON.

Entrada

Entrada de Imagem (Image Input): Este campo aceita:
- Uma URL pública de uma imagem (ex., https://example.com/image.jpg).
- O nome da propriedade binária de um nó anterior. Por exemplo, se um nó Ler Arquivo Binário (Read Binary File) gerar dados em uma propriedade chamada data, você usaria uma expressão e digitaria data neste campo.

Parâmetros

Modelo (Model): Escolha o modelo de legendagem de imagem a ser usado.
- ViT-GPT2 Image Captioning (Default): Um modelo robusto de propósito geral.
- BLIP Image Captioning (Base): Um modelo mais moderno e frequentemente mais preciso.
- BLIP Image Captioning (Large): Uma versão maior do BLIP para resultados potencialmente melhores, com um custo no desempenho.
Campo de Saída da Legenda (Output Caption Field): O nome do campo onde a legenda gerada será armazenada. O padrão é caption.
Máximo de Novos Tokens (Max New Tokens): (Opcional) Controla o comprimento máximo da legenda gerada. O padrão é 50.
Incluir Saída Completa (Include Full Output): (Opcional) Se ativado, inclui a saída completa e bruta do modelo em um campo chamado [Nome do Campo de Saída]_full.

Exemplo de Saída

Se o Campo de Saída da Legenda estiver definido como caption, a saída será assim:

{
  "caption": "um gato está sentado em um sofá",
  "outro_campo_de_entrada": "algum_valor"
}

Fluxo de Trabalho de Exemplo

Aqui está um exemplo básico de um fluxo de trabalho que lê uma imagem de uma URL и gera uma legenda.

{
  "nodes": [
    {
      "parameters": {},
      "name": "Start",
      "type": "n8n-nodes-base.start",
      "typeVersion": 1,
      "position": [
        250,
        300
      ]
    },
    {
      "parameters": {
        "imageInput": "https://huggingface.co/datasets/Narsil/image_dummy/raw/main/parrots.png",
        "model": "Xenova/vit-gpt2-image-captioning",
        "outputFieldName": "image_caption"
      },
      "name": "Image to Text",
      "type": "imageToTextCaptioning",
      "typeVersion": 1,
      "position": [
        450,
        300
      ],
      "credentials": {}
    }
  ],
  "connections": {
    "Start": {
      "main": [
        [
          {
            "node": "Image to Text",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}

Para usar este fluxo de trabalho, copie o JSON e cole na sua tela do n8n.

Compatibilidade

Requer n8n versão 1.0 ou superior.
Requer Node.js versão 20.15 ou superior.

Licença

MIT

Published

Vulnerabilities

Links

Maintainers

Keywords

Readme