Текстов Конвертор

Sheetize Text Converter за .NET предоставя прост начин за преобразуване на файлове като PDF, DOCX и HTML в чист текст и обратно, подкрепяйки случаи на употреба като извличане на данни, дългосрочно съхранение и взаимодействие с платформи, които приемат само текст.

Ключови функции

Извличане на текст от документи

Извличане на текстови данни от различни типове файлове, полезно за процесни конвейери и архивни цели.

Генериране на документи от текст

Създаване на структурирани файлове от неструктуриран текст, което опростява изготвянето на отчети или форматирани изходи.


Подробно ръководство

Преобразуване на документ в чист текст

Стъпки за конвертиране на файл в чист текст:

  1. Подгответе конвертора: Подгответе TextConverter .
  2. Конфигурирайте опции: Използвайте SaveOptions за задаване на параметрите на конверсията.
  3. Посочете вход/изход: Укажете местоположенията на изходния и целевия файл.
  4. Изпълнете процеса: Извикайте Process с подготвените опции.

Пример: Конвертиране на PDF към текст

// Step 1: Create the converter
var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

Конверторът е от съществено значение за сценарии, изискващи извличане на неструктуриран текст, като създаване на търсими архиви или подаване на данни към процеси, ориентирани към текст.

 Български