Textkonverter
Der Sheetize Text Converter für .NET ermöglicht die Konvertierung von Dokumenten in und aus reibungslosem Textformat, ideal für Datenerhebung, Archivierung und Integration mit Textbasierten Systemen.
Hauptmerkmale
Umwandeln von Dokumenten in Plain Text
Textinhalte aus Dokumenten wie PDF, DOCX und HTML extrahieren, nützlich für die Datenverarbeitung und Archivierung.
Konvertieren Sie Plain Text in Dokumentformate
Erstellen Sie formatierte Dokumente aus reibungslosem Text, die eine einfache Möglichkeit bieten, Berichte oder strukturierte Dateien zu generieren.
Detaillierte Leitfaden
Umwandeln des Dokuments in Plain Text
Um ein Dokument in klares Text zu konvertieren:
- Initialisieren Sie den Converter : Erstellen Sie eine
TextConverter
. - Set Konvertierungsoptionen : Verwenden
DocumentToTextOptions
Konfigurieren der Ausgangsinstellungen. - Definieren Sie Ein- und Ausgangspathen : Set-Paths for the input document and output text file.
- Durchführen Sie die Konvertierung : Rufen Sie den
Process
Methode zur Konvertierung des Dokuments.
Beispiel: Umwandeln von PDF in Plain Text
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Der Text Converter ist für Szenarien, in denen Text-Extraktion erforderlich ist, wie zum Beispiel die Erstellung von Archiven oder die Verarbeitung von Daten in reichem Text.