Текстовый конвертер
Sheetize Text Converter для .NET позволяет конвертировать документы в и из плоского текстового формата, идеально подходит для извлечения данных, архивирования и интеграции с текстовыми системами.
Ключевые особенности
Конвертировать документы в плоский текст
Экстракт текстового контента из документов, таких как PDF, DOCX и HTML, полезный для обработки и архивирования данных.
Конвертировать плоский текст в форматы документа
Создание форматированных документов из плоского текста, обеспечивающего легкий способ генерировать отчеты или структурированные файлы.
Подробный водитель
Конвертирование документа в плоский текст
Чтобы конвертировать документ в четкий текст:
- Иницијализуйте конвертер : создайте
TextConverter
. - Настройка опций конверсии : Использование
DocumentToTextOptions
Конфигурировать настройки выхода. - Определите входные и выходные пути : установите маршруты для входящего документа и текстового файла выхода.
- Используйте конверсию: звоните
Process
Метод конвертации документа.
Пример: Конвертировать PDF в плоский текст
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Конвертер текста необходим для сценариев, в которых требуется текстовое извлечение, например, создание архивов или обработка данных в прямом тексте.