Используйте Python API конвертации форматов документов для разработки высокоуровневого кроссплатформенного ПО. Это профессиональное программное решение для импорта и экспорта PDF, TXT и многих других форматов документов с использованием языка Python.
Вам нужно программно преобразовать документ из формата PDF в формат TXT? С помощью Aspose.Words for Python via .NET любой разработчик может конвертировать документы из формата PDF в формат TXT с помощью всего лишь нескольких строк кода Python.
Современный API обработки документов Python создает документ TXT из PDF с профессиональным качеством. Проверьте преобразование PDF в TXT высочайшего качества прямо в браузере. Мощная библиотека Python позволяет конвертировать файлы PDF практически во все форматы документов TXT.
В следующем примере показано, как преобразовать формат документа PDF в формат TXT в Python.
Следуйте простым шагам, чтобы преобразовать файл PDF в формат документа TXT. Прочтите файл PDF с локального диска, а затем просто сохраните его в формате документа TXT, указав необходимый формат файла с требуемым расширением TXT. Как для чтения PDF, так и для записи документов TXT вы можете использовать полные имена файлов. Выходное содержимое TXT и форматирование будут идентичны исходному документу PDF.
pip install aspose-words
Копировать
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document("Input.pdf")
save_options = aw.saving.ImageSaveOptions(aw.SaveFormat.txt)
for page in range(doc.page_count):
save_options.page_set = aw.saving.PageSet(page)
doc.save(f"Output_{page + 1}.txt", save_options)
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
builder.insert_image("Input.pdf")
doc.save("Output.txt")
import aspose.words as aw
doc = aw.Document()
builder = aw.DocumentBuilder(doc)
shape = builder.insert_image("Input.pdf")
shape.get_shape_renderer().save("Output.txt", aw.saving.ImageSaveOptions(aw.SaveFormat.txt))
Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.
Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.
Вы можете конвертировать PDF во многие другие форматы: