Textkonverter

Der Sheetize Textkonverter für .NET bietet eine unkomplizierte Möglichkeit, Dateien wie PDFs, DOCX und HTML in Klartext zu verwandeln und umgekehrt. Er unterstützt Anwendungsfälle wie Data Mining, langfristige Archivierung und die Interaktion mit rein textbasierten Plattformen.

Hauptfunktionen

Text aus Dokumenten extrahieren

Extrahieren Sie Textdaten aus verschiedenen Dateitypen – nützlich für Verarbeitungs‑Pipelines und Archivierungszwecke.

Dokumente aus Text generieren

Erzeugen Sie strukturierte Dateien aus Rohtext, was die Erstellung von Berichten oder formatierter Ausgabe vereinfacht.


Ausführliche Anleitung

Ein Dokument in Klartext umwandeln

Schritte zur Konvertierung einer Datei in Klartext:

  1. Konverter vorbereiten: Initialisieren Sie TextConverter .
  2. Optionen konfigurieren: Verwenden Sie SaveOptions , um die Konvertierungsparameter festzulegen.
  3. Eingabe/Ausgabe angeben: Geben Sie Quelle‑ und Zielpfade an.
  4. Prozess starten: Rufen Sie Process mit den vorbereiteten Optionen auf.

Beispiel: PDF‑zu‑Text‑Konvertierung

// Schritt 1: Konverter erstellen
var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",
};

var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

Der Konverter ist unverzichtbar für Szenarien, die eine Rohtext‑Extraktion erfordern, etwa beim Aufbau durchsuchbarer Archive oder der Einspeisung von Daten in textzentrierte Workflows.

 Deutsch