Text Converter
Der Sheetize Text Converter für .NET ermöglicht die Umwandlung von Dokumenten in und aus dem Format einfachem Text, ideal für die Datenextraktion, Archivierung und Integration mit textbasierten Systemen.
Hauptmerkmale
Dokumente in einfachen Text konvertieren
Extrahieren Sie den Textinhalt aus Dokumenten wie PDF, DOCX und HTML, was nützlich für die Datenverarbeitung und Archivierung ist.
Einfachen Text in Dokumentformate konvertieren
Erstellen Sie formatierte Dokumente aus einfachem Text und bieten Sie eine einfache Möglichkeit, Berichte oder strukturierte Dateien zu generieren.
Detaillierter Leitfaden
Konvertieren eines Dokuments in einfachen Text
Um ein Dokument in einfachen Text zu konvertieren:
- Den Konverter initialisieren: Erstellen Sie eine Instanz von
TextConverter
. - Konversionsoptionen festlegen: Verwenden Sie
DocumentToTextOptions
, um die Ausgabeeinstellungen zu konfigurieren. - Eingangs- und Ausgangspfade definieren: Legen Sie die Pfade für das Eingabedokument und die Ausgabedatei fest.
- Die Konvertierung ausführen: Rufen Sie die Methode
Process
auf, um das Dokument zu konvertieren.
Beispiel: PDF in einfachen Text konvertieren
// Schritt 1: Den Text Converter initialisieren
var converter = new TextConverter();
// Schritt 2: Optionen für die Konvertierung von Dokument zu Text konfigurieren
var options = new DocumentToTextOptions();
// Schritt 3: Dateipfade festlegen
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Schritt 4: Die Konvertierung ausführen
converter.Process(options);
Der Text Converter ist unerlässlich für Szenarien, in denen eine Textextraktion erforderlich ist, wie zum Beispiel bei der Erstellung von Archiven oder der Verarbeitung von Daten im einfachen Textformat.