Stack Docker y workflow
Servicios
El stack principal esta en containers/docker-compose.yml.
n8n: orquesta el workflow completo.grobid: convierte PDFs en XML TEI.pipegrobid: ejecuta el pipeline inicial de PipeGrobid.python_runner: ejecuta scripts Python llamados desde n8n con dependencias instaladas.fuseki: triplestore SPARQL para el KG.research_api: API FastAPI que consulta Fuseki.research_frontend: frontend Streamlit para explorar el KG.
Prerrequisitos
- Docker Desktop levantado.
- PDFs colocados en
pdfs/. containers/.envcreado desdecontainers/.env.example.GROQ_API_KEYyHF_TOKENsi se ejecutan los pasos que usan LLM/HuggingFace.
Levantar servicios
Primera ejecucion:
docker compose -f containers/docker-compose.yml up --build -d
Ejecuciones posteriores:
docker compose -f containers/docker-compose.yml up -d
URLs principales:
n8n: http://localhost:5678
research_api: http://localhost:8000/docs
research_frontend http://localhost:8501
fuseki: http://localhost:3030
Ejecutar workflow
- Abrir
http://localhost:5678. - Importar
containers/workflow/pipegrobid_workflow.json. - Entrar en
pipegrobid_workflow. - Ejecutar el workflow manualmente.
- Esperar a que termine el procesamiento y la carga del KG en Fuseki.
- Abrir
http://localhost:8501. - Pulsar
Actualizar datospara limpiar cache de Streamlit.
El boton Actualizar datos no reconstruye el KG; solo fuerza al frontend a consultar de nuevo research_api.