Convertor de Text
Sheetize Text Converter for .NET oferă o modalitate simplă de a transforma fișiere precum PDF, DOCX și HTML în text simplu și invers, susținând scenarii de tipul mineritului de date, stocării pe termen lung și interacțiunii cu platforme care acceptă doar text.
Caracteristici principale
Extrage text din documente
Obține date textuale din diverse tipuri de fișiere, util pentru lanțuri de procesare și scopuri de arhivare.
Generează documente din text
Construiește fișiere structurate din text brut, simplificând crearea de rapoarte sau rezultate formatate.
Ghid detaliat
Conversia unui document în text simplu
Pașii pentru a converti un fișier în text simplu:
- Pregătește Convertorul: Pregătește
TextConverter. - Configurează opțiunile: Folosește
SaveOptionspentru a seta parametrii de conversie. - Specifică intrarea/ieșirea: Furnizează locațiile fișierului sursă și destinație.
- Rulează procesul: Apelează
Processcu opțiunile pregătite.
Exemplu: Conversie PDF → Text
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Convertorul este esențial pentru scenarii care necesită extragerea textului brut, cum ar fi construirea de arhive căutabile sau alimentarea datelor în fluxuri de lucru centrate pe text.