Szövegkonverter
A Sheetize Text Converter for .NET egyszerű módot kínál PDF, DOCX és HTML fájlok egyszerű szöveggé és visszaalakítására, támogatva az adatbányászat, hosszú távú tárolás és a csak szöveges platformokkal való interakció igényeit.
Kulcsfontosságú funkciók
Szöveg kinyerése dokumentumokból
Szöveges adatok kinyerése különböző fájltípusokból, ami hasznos a feldolgozási csővezetékekhez és archiváláshoz.
Dokumentumok generálása szövegből
Strukturált fájlok létrehozása nyers szövegből, megkönnyítve jelentések vagy formázott kimenetek készítését.
Részletes útmutató
Dokumentum átalakítása egyszerű szöveggé
A fájl egyszerű szöveggé konvertálásának lépései:
- a konverter előkészítése: Készítsük elő a
TextConverter. - beállítások konfigurálása: Használjuk a
SaveOptionsobjektumot a konverziós paraméterek megadásához. - bemenet/kimenet megadása: Adjunk meg forrás- és célfájl helyeket.
- a folyamat elindítása: Hívjuk meg a
Processmetódust a előkészített beállításokkal.
Példa: PDF szöveggé konvertálása
// 1. lépés: Létrehozzuk a konvertert
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);A konverter elengedhetetlen olyan esetekben, amikor nyers szöveg kinyerése szükséges, például kereshető archívumok építése vagy adatbetáplálás szövegre épülő munkafolyamatokba.