Konwerter tekstu
Sheetize Text Converter dla .NET umożliwia konwersję dokumentów do i z płaskiego formatu tekstu, idealny do ekstrakcji danych, archiwizacji i integracji z systemami opartymi na tekście.
Główne cechy
Konwersja dokumentów na płaski tekst
Ekstrakcja treści tekstowych z dokumentów, takich jak PDF, DOCX i HTML, przydatne do przetwarzania danych i archiwizacji.
Konwersja płaskiego tekstu do formatów dokumentów
Tworzenie formatowanych dokumentów z płaskiego tekstu, zapewniając łatwy sposób na generowanie raportów lub strukturowanych plików.
Szczegółowy przewodnik
Konwersja dokumentu na płaski tekst
Aby przekonwertować dokument na prosty tekst:
- Inicjalizuj konwerter : Stwórz instancję
TextConverter
. - Zestaw opcji konwersji : Użyj
DocumentToTextOptions
Aby skonfigurować ustawienia wyjścia. - Wyznacz wejście i wyjście Paths : ustaw ścieżki dla dokumentu wejściowego i pliku tekstowego wyjścia.
- Wykonaj konwersję : zadzwoń do
Process
Metoda konwersji dokumentu.
Przykład: Konwersja PDF do płaskiego tekstu
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Konwerter tekstu jest niezbędny dla scenariuszy, w których potrzebna jest ekstrakcja tekstu, na przykład tworzenie archiwów lub przetwarzanie danych w płaskim tekście.