← Назад
Open Source📊 data
MarkItDown
Легкий инструмент Python для преобразования файлов и офисных документов в Markdown для использования с LLM и конвейерами анализа текста.
github.com →📊Categorydata
🆓PricingOpen Source
О компании
MarkItDown - это утилита Python с открытым исходным кодом от Microsoft, которая преобразует широкий спектр типов файлов в Markdown, сохраняя при этом структуру документа, такую как заголовки, списки, таблицы и ссылки. Он поддерживает PDF, Word, PowerPoint, Excel, изображения (OCR и EXIF), аудио (транскрипция), HTML, CSV/JSON/XML, ZIP-архивы, EPubs и URL-адреса YouTube. Разработанный для использования в LLM и инструментах анализа текста, он наиболее полезен для разработчиков, создающих конвейеры данных и искусственного интеллекта. Он распространяется по лицензии MIT и устанавливается через pip.
Цены
🌐






