📦 jocile/Docling-gpu-ollama
Script em Python desenvolvido para processar e converter documentos PDF utilizando a biblioteca Docling, com aceleração via GPU (CUDA) e integração ao ecossistema Ollama/VLM.
Repositório: Docling-gpu-ollama
Tecnologias: Python,CUDA,Ollama,Docling
🎯 Contexto
- Objetivo Relacionado: Processamento de documentos PDF com alta performance utilizando GPU para inferência VLM (Vision Language Model)
- Deploy/Ambiente: Local (Windows/Linux) via ambiente virtual Python (
venv) com PyTorch CUDA 13.5
⚙️ DevOps & Manutenção
📋 Tarefas (Backlog)
🔧 Principais Scripts do Projeto
convertpdf.py
Processamento principal de PDFs com:
- Aceleração por GPU (CUDA) via
AcceleratorDevice.CUDA - Processamento multithread (
ThreadedStandardPdfPipeline) - Batching otimizado: layout_batch_size=64, table_batch_size=4
converthtml.py
Script simplificado para extração de dados diretamente de URLs HTML.
📖 Documentação Adicional
Referências completas sobre GPU acceleration com Docling estão disponíveis no repositório oficial: