Text Converter

El Sheetize Text Converter per a .NET ofereix una manera senzilla de transformar fitxers com PDF, DOCX i HTML en text pla i tornar‑los al format original, suportant casos d’ús com mineria de dades, emmagatzematge a llarg termini i interacció amb plataformes només de text.

Característiques principals

Extreu text dels documents

Obté dades textuals de diversos tipus de fitxers, útil per a pipelines de processament i fins d’arxiu.

Genera documents a partir del text

Crea fitxers estructurats a partir de text brut, simplificant la generació d’informes o sortides formatades.


Guia detallada

Com convertir un document a text pla

Passos per convertir un fitxer a text pla:

  1. Prepara el Convertidor: Prepara TextConverter .
  2. Configura les opcions: Utilitza SaveOptions per establir els paràmetres de conversió.
  3. Especifica l’entrada/sortida: Indica les ubicacions del fitxer d’origen i del destí.
  4. Executa el procés: Crida Process amb les opcions preparades.

Exemple: Conversió de PDF a text

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

El convertidor és fonamental per a escenaris que requereixen l’extracció de text brut, com la creació d’arxius buscables o la integració de dades en fluxos de treball centrats en text.

 Català