Конвертер Текста

Sheetize Text Converter for .NET предоставляет простой способ преобразовать файлы, такие как PDF, DOCX и HTML, в обычный текст и обратно, поддерживая сценарии, такие как добыча данных, долговременное хранение и взаимодействие с платформами, поддерживающими только текст.

Ключевые возможности

Извлечение текста из документов

Получайте текстовые данные из различных типов файлов, что полезно для конвейеров обработки и архивных целей.

Создание документов из текста

Создавайте структурированные файлы из сырого текста, упрощая создание отчетов или отформатированных выводов.


Подробное руководство

Преобразование документа в простой текст

Шаги для конвертации файла в обычный текст:

  1. Подготовьте конвертер: подготовьте TextConverter .
  2. Настройте параметры: используйте SaveOptions для задания параметров конвертации.
  3. Укажите входные/выходные файлы: задайте пути к исходному и целевому файлам.
  4. Запустите процесс: вызовите Process с подготовленными параметрами.

Пример: преобразование PDF в текст

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

Конвертер незаменим в сценариях, требующих извлечения сырого текста, например, при создании поисковых архивов или передаче данных в рабочие процессы, ориентированные на текст.

 Русский