Textový konvertér
Sheetize Text Converter pre .NET poskytuje jednoduchý spôsob, ako previesť súbory ako PDF, DOCX a HTML na čistý text a späť, podporujúc prípady použitia ako ťažba dát, dlhodobé úložisko a interakciu s platformami iba s textom.
Kľúčové funkcie
Extrahovať text z dokumentov
Získajte textové dáta z rôznych typov súborov, čo je užitočné pre spracovateľské pipeline a archiváciu.
Generovať dokumenty z textu
Vytvorte štruktúrované súbory z čistého textu, čo zjednodušuje tvorbu správ alebo formátovaných výstupov.
Podrobný návod
Prevod dokumentu na čistý text
Kroky na konverziu súboru na čistý text:
- Pripravte konvertér: Pripravte
TextConverter. - Nakonfigurujte možnosti: Použite
SaveOptionsna nastavenie parametrov konverzie. - Zadajte vstup/výstup: Poskytnite umiestnenia zdrojového a cieľového súboru.
- Spustite proces: Zavolajte
Processs pripravenými možnosťami.
Ukážka: Konverzia PDF na text
// Step 1: Create the converter
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Konvertér je nevyhnutný pre scenáre vyžadujúce extrakciu surového textu, napríklad pri budovaní prehľadateľných archívov alebo pri napájaní dát do textovo‑centrických pracovných tokov.