Textkonverter

Der Sheetize Text Converter für .NET ermöglicht die Konvertierung von Dokumenten in und aus reibungslosem Textformat, ideal für Datenerhebung, Archivierung und Integration mit Textbasierten Systemen.

Hauptmerkmale

Umwandeln von Dokumenten in Plain Text

Textinhalte aus Dokumenten wie PDF, DOCX und HTML extrahieren, nützlich für die Datenverarbeitung und Archivierung.

Konvertieren Sie Plain Text in Dokumentformate

Erstellen Sie formatierte Dokumente aus reibungslosem Text, die eine einfache Möglichkeit bieten, Berichte oder strukturierte Dateien zu generieren.

Detaillierte Leitfaden

Umwandeln des Dokuments in Plain Text

Um ein Dokument in klares Text zu konvertieren:

  • Initialisieren Sie den Converter : Erstellen Sie eine TextConverter.
  • Set Konvertierungsoptionen : Verwenden DocumentToTextOptions Konfigurieren der Ausgangsinstellungen.
  • Definieren Sie Ein- und Ausgangspathen : Set-Paths for the input document and output text file.
  • Durchführen Sie die Konvertierung : Rufen Sie den Process Methode zur Konvertierung des Dokuments.

Beispiel: Umwandeln von PDF in Plain Text

// Step 1: Initialize the Text Converter
var converter = new TextConverter();

// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();

// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));

// Step 4: Execute the conversion
converter.Process(options);

Der Text Converter ist für Szenarien, in denen Text-Extraktion erforderlich ist, wie zum Beispiel die Erstellung von Archiven oder die Verarbeitung von Daten in reichem Text.

 Deutsch