Textový konvertér

Sheetize Text Converter pre .NET poskytuje jednoduchý spôsob, ako previesť súbory ako PDF, DOCX a HTML na čistý text a späť, podporujúc prípady použitia ako ťažba dát, dlhodobé úložisko a interakciu s platformami iba s textom.

Kľúčové funkcie

Extrahovať text z dokumentov

Získajte textové dáta z rôznych typov súborov, čo je užitočné pre spracovateľské pipeline a archiváciu.

Generovať dokumenty z textu

Vytvorte štruktúrované súbory z čistého textu, čo zjednodušuje tvorbu správ alebo formátovaných výstupov.


Podrobný návod

Prevod dokumentu na čistý text

Kroky na konverziu súboru na čistý text:

  1. Pripravte konvertér: Pripravte TextConverter .
  2. Nakonfigurujte možnosti: Použite SaveOptions na nastavenie parametrov konverzie.
  3. Zadajte vstup/výstup: Poskytnite umiestnenia zdrojového a cieľového súboru.
  4. Spustite proces: Zavolajte Process s pripravenými možnosťami.

Ukážka: Konverzia PDF na text

// Step 1: Create the converter
var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

Konvertér je nevyhnutný pre scenáre vyžadujúce extrakciu surového textu, napríklad pri budovaní prehľadateľných archívov alebo pri napájaní dát do textovo‑centrických pracovných tokov.

 Slovenčina