Конвертер Текста
Sheetize Text Converter for .NET предоставляет простой способ преобразовать файлы, такие как PDF, DOCX и HTML, в обычный текст и обратно, поддерживая сценарии, такие как добыча данных, долговременное хранение и взаимодействие с платформами, поддерживающими только текст.
Ключевые возможности
Извлечение текста из документов
Получайте текстовые данные из различных типов файлов, что полезно для конвейеров обработки и архивных целей.
Создание документов из текста
Создавайте структурированные файлы из сырого текста, упрощая создание отчетов или отформатированных выводов.
Подробное руководство
Преобразование документа в простой текст
Шаги для конвертации файла в обычный текст:
- Подготовьте конвертер: подготовьте
TextConverter. - Настройте параметры: используйте
SaveOptionsдля задания параметров конвертации. - Укажите входные/выходные файлы: задайте пути к исходному и целевому файлам.
- Запустите процесс: вызовите
Processс подготовленными параметрами.
Пример: преобразование PDF в текст
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Конвертер незаменим в сценариях, требующих извлечения сырого текста, например, при создании поисковых архивов или передаче данных в рабочие процессы, ориентированные на текст.