Text Converter
Sheetize Text Converter dla .NET umożliwia konwersję dokumentów na i z formatu plain text, idealnego do ekstrakcji danych, archiwizacji i integracji z systemami opartymi na tekście.
Kluczowe cechy
Konwersja dokumentów na plain text
Ekstaktowanie treści tekstowej z dokumentów takich jak PDF, DOCX i HTML, przydatne do przetwarzania danych i archiwizacji.
Konwersja plain text na formaty dokumentów
Tworzenie sformatowanych dokumentów z plain text, co stanowi łatwy sposób na generowanie raportów lub uporządkowanych plików.
Szczegółowy przewodnik
Konwersja dokumentu na plain text
Aby skonwertować dokument na plain text:
- Zainicjalizuj konwerter: Utwórz instancję
TextConverter
. - Ustaw opcje konwersji: Użyj
DocumentToTextOptions
, aby skonfigurować ustawienia wyjściowe. - Zdefiniuj ścieżki wejściowe i wyjściowe: Ustaw ścieżki dla dokumentu wejściowego i pliku tekstowego wyjściowego.
- Wykonaj konwersję: Wywołaj metodę
Process
, aby skonwertować dokument.
Przykład: Konwersja PDF na plain text
// Krok 1: Zainicjalizuj konwerter tekstu
var converter = new TextConverter();
// Krok 2: Skonfiguruj opcje konwersji dokumentu na tekst
var options = new DocumentToTextOptions();
// Krok 3: Ustaw ścieżki do plików
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Krok 4: Wykonaj konwersję
converter.Process(options);
Konwerter tekstu jest niezbędny w scenariuszach, w których potrzebna jest ekstrakcja tekstu, takich jak tworzenie archiwów lub przetwarzanie danych w formacie plain text.