GitHub - kreuzberg-dev/kreuzberg: A polyglot document intelligence framework with a Rust core. Extract text, metadata, and structured information from PDFs, Office documents, images, and 75+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir
Un outil d'extraction de texte pour injection dans les LLM qui semble supporter de tres nombreux formats. Ca doit tres certainement pouvoir s'utiliser dans d'autres contextes que les LLM
— Permalink