Текстов Конвертор
Sheetize Text Converter за .NET предоставя прост начин за преобразуване на файлове като PDF, DOCX и HTML в чист текст и обратно, подкрепяйки случаи на употреба като извличане на данни, дългосрочно съхранение и взаимодействие с платформи, които приемат само текст.
Ключови функции
Извличане на текст от документи
Извличане на текстови данни от различни типове файлове, полезно за процесни конвейери и архивни цели.
Генериране на документи от текст
Създаване на структурирани файлове от неструктуриран текст, което опростява изготвянето на отчети или форматирани изходи.
Подробно ръководство
Преобразуване на документ в чист текст
Стъпки за конвертиране на файл в чист текст:
- Подгответе конвертора: Подгответе
TextConverter. - Конфигурирайте опции: Използвайте
SaveOptionsза задаване на параметрите на конверсията. - Посочете вход/изход: Укажете местоположенията на изходния и целевия файл.
- Изпълнете процеса: Извикайте
Processс подготвените опции.
Пример: Конвертиране на PDF към текст
// Step 1: Create the converter
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Конверторът е от съществено значение за сценарии, изискващи извличане на неструктуриран текст, като създаване на търсими архиви или подаване на данни към процеси, ориентирани към текст.