Tekstni konverter
Sheetize Text Converter za .NET omogućuje konverziju dokumenata u i iz ravnog formata teksta, idealno za ekstrakciju podataka, arhiviranje i integraciju s sustavima koji se temelje na tekstu.
Ključne značajke
Konvertiranje dokumenata u plain tekst
Ekstrakcija tekstnog sadržaja iz dokumenata kao što su PDF, DOCX i HTML, korisna za obradu podataka i arhiviranje.
Konvertirati tekst u formate dokumenata
Stvorite formatirane dokumente iz ravnog teksta, pružajući jednostavan način za stvaranje izvješća ili strukturiranih datoteka.
Detaljni vodič
Konvertiranje dokumenta u plain tekst
Kako pretvoriti dokument u jednostavan tekst:
- Inicializirajte konverter : Stvorite primjer
TextConverter
. - Postavite opcije konverzije : Koristite
DocumentToTextOptions
Uklanjanje nastavaka izlaska. - Određivanje ulaznih i izlaznih staza : Sastavite staze za uputni dokument i izvornu tekstnu datoteku.
- Izvođenje konverzije : pozovite
Process
Metoda pretvaranja dokumenta.
Primjer: pretvoriti PDF u plain tekst
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Tekstni konverter je neophodan za scenarije u kojima je potrebna ekstrakcija teksta, kao što je stvaranje arhiva ili obrada podataka u ravnom tekstu.