текстуални конвертер
Sheetize Text Converter за .NET омогућава конверзију докумената у и из равни текстуални формат, идеалан за извлачење података, архивирање и интеграцију са текстуалним системима.
Кључне карактеристике
Претварање докумената у једноставан текст
Екстрактирање текстуалног садржаја из докумената као што су ПДФ, ДОЦКС и ХТМЛ, корисно за обраду података и архивирање.
Конвертовање плоског текста у формати докумената
Креирајте форматиране документе из равног текста, пружајући једноставан начин за генерисање извештаја или структурираних датотека.
Детаљни водич
Претварање документа у једноставан текст
Да би се документ претворио у јасан текст:
- Иницијалишете конвертер : креирајте инстанцију
TextConverter
. - Сет опције за конверзију : Употреба
DocumentToTextOptions
Конфигурисање подешавања излаза. - Опремите улазни и излазни путеви : Поставите путеве за уносну документацију и текстуалну датотеку.
- Извршите конверзију : Позовите
Process
Метода конверзије документа.
Пример: Конвертовање ПДФ-а у Плаин текст
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Текст конвертер је од суштинског значаја за сценарије у којима је потребна текстуална екстракција, као што је креирање архива или обрада података у равном тексту.