Textkonverter
Der Sheetize Textkonverter für .NET bietet eine unkomplizierte Möglichkeit, Dateien wie PDFs, DOCX und HTML in Klartext zu verwandeln und umgekehrt. Er unterstützt Anwendungsfälle wie Data Mining, langfristige Archivierung und die Interaktion mit rein textbasierten Plattformen.
Hauptfunktionen
Text aus Dokumenten extrahieren
Extrahieren Sie Textdaten aus verschiedenen Dateitypen – nützlich für Verarbeitungs‑Pipelines und Archivierungszwecke.
Dokumente aus Text generieren
Erzeugen Sie strukturierte Dateien aus Rohtext, was die Erstellung von Berichten oder formatierter Ausgabe vereinfacht.
Ausführliche Anleitung
Ein Dokument in Klartext umwandeln
Schritte zur Konvertierung einer Datei in Klartext:
- Konverter vorbereiten: Initialisieren Sie
TextConverter. - Optionen konfigurieren: Verwenden Sie
SaveOptions, um die Konvertierungsparameter festzulegen. - Eingabe/Ausgabe angeben: Geben Sie Quelle‑ und Zielpfade an.
- Prozess starten: Rufen Sie
Processmit den vorbereiteten Optionen auf.
Beispiel: PDF‑zu‑Text‑Konvertierung
// Schritt 1: Konverter erstellen
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Der Konverter ist unverzichtbar für Szenarien, die eine Rohtext‑Extraktion erfordern, etwa beim Aufbau durchsuchbarer Archive oder der Einspeisung von Daten in textzentrierte Workflows.