Convertidor de Texto

El Convertidor de Texto Sheetize para .NET ofrece una forma sencilla de convertir archivos como PDF, DOCX y HTML a texto plano y volver a generar los documentos originales, apoyando casos de uso como minería de datos, almacenamiento a largo plazo e interacción con plataformas solo de texto.

Características principales

Extraer texto de documentos

Obtén datos textuales de varios tipos de archivo, útil para pipelines de procesamiento y propósitos de archivado.

Generar documentos a partir de texto

Construye archivos estructurados a partir de texto sin formato, simplificando la creación de informes o salidas formateadas.


Guía detallada

Convertir un documento a texto plano

Pasos para convertir un archivo a texto plano:

  1. Preparar el convertidor: Prepara TextConverter .
  2. Configurar opciones: Usa SaveOptions para establecer los parámetros de conversión.
  3. Especificar entrada/salida: Proporciona las ubicaciones del archivo de origen y del archivo de destino.
  4. Ejecutar el proceso: Llama a Process con las opciones preparadas.

Ejemplo: conversión de PDF a texto

// Paso 1: Crear el convertidor
var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

El convertidor es fundamental para escenarios que requieren extracción de texto sin procesar, como la creación de archivos archivables buscables o la alimentación de datos en flujos de trabajo centrados en texto.

 Español