Szövegkonverter

A Sheetize Text Converter for .NET egyszerű módot kínál PDF, DOCX és HTML fájlok egyszerű szöveggé és visszaalakítására, támogatva az adatbányászat, hosszú távú tárolás és a csak szöveges platformokkal való interakció igényeit.

Kulcsfontosságú funkciók

Szöveg kinyerése dokumentumokból

Szöveges adatok kinyerése különböző fájltípusokból, ami hasznos a feldolgozási csővezetékekhez és archiváláshoz.

Dokumentumok generálása szövegből

Strukturált fájlok létrehozása nyers szövegből, megkönnyítve jelentések vagy formázott kimenetek készítését.


Részletes útmutató

Dokumentum átalakítása egyszerű szöveggé

A fájl egyszerű szöveggé konvertálásának lépései:

  1. a konverter előkészítése: Készítsük elő a TextConverter .
  2. beállítások konfigurálása: Használjuk a SaveOptions objektumot a konverziós paraméterek megadásához.
  3. bemenet/kimenet megadása: Adjunk meg forrás- és célfájl helyeket.
  4. a folyamat elindítása: Hívjuk meg a Process metódust a előkészített beállításokkal.

Példa: PDF szöveggé konvertálása

// 1. lépés: Létrehozzuk a konvertert
var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

A konverter elengedhetetlen olyan esetekben, amikor nyers szöveg kinyerése szükséges, például kereshető archívumok építése vagy adatbetáplálás szövegre épülő munkafolyamatokba.

 Magyar