Convertidor de Texto
El Convertidor de Texto Sheetize para .NET ofrece una forma sencilla de convertir archivos como PDF, DOCX y HTML a texto plano y volver a generar los documentos originales, apoyando casos de uso como minería de datos, almacenamiento a largo plazo e interacción con plataformas solo de texto.
Características principales
Extraer texto de documentos
Obtén datos textuales de varios tipos de archivo, útil para pipelines de procesamiento y propósitos de archivado.
Generar documentos a partir de texto
Construye archivos estructurados a partir de texto sin formato, simplificando la creación de informes o salidas formateadas.
Guía detallada
Convertir un documento a texto plano
Pasos para convertir un archivo a texto plano:
- Preparar el convertidor: Prepara
TextConverter. - Configurar opciones: Usa
SaveOptionspara establecer los parámetros de conversión. - Especificar entrada/salida: Proporciona las ubicaciones del archivo de origen y del archivo de destino.
- Ejecutar el proceso: Llama a
Processcon las opciones preparadas.
Ejemplo: conversión de PDF a texto
// Paso 1: Crear el convertidor
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);El convertidor es fundamental para escenarios que requieren extracción de texto sin procesar, como la creación de archivos archivables buscables o la alimentación de datos en flujos de trabajo centrados en texto.