Tekstni konverter

Sheetize Text Converter za .NET omogućuje konverziju dokumenata u i iz ravnog formata teksta, idealno za ekstrakciju podataka, arhiviranje i integraciju s sustavima koji se temelje na tekstu.

Ključne značajke

Konvertiranje dokumenata u plain tekst

Ekstrakcija tekstnog sadržaja iz dokumenata kao što su PDF, DOCX i HTML, korisna za obradu podataka i arhiviranje.

Konvertirati tekst u formate dokumenata

Stvorite formatirane dokumente iz ravnog teksta, pružajući jednostavan način za stvaranje izvješća ili strukturiranih datoteka.

Detaljni vodič

Konvertiranje dokumenta u plain tekst

Kako pretvoriti dokument u jednostavan tekst:

  • Inicializirajte konverter : Stvorite primjer TextConverter.
  • Postavite opcije konverzije : Koristite DocumentToTextOptions Uklanjanje nastavaka izlaska.
  • Određivanje ulaznih i izlaznih staza : Sastavite staze za uputni dokument i izvornu tekstnu datoteku.
  • Izvođenje konverzije : pozovite Process Metoda pretvaranja dokumenta.

Primjer: pretvoriti PDF u plain tekst

// Step 1: Initialize the Text Converter
var converter = new TextConverter();

// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();

// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));

// Step 4: Execute the conversion
converter.Process(options);

Tekstni konverter je neophodan za scenarije u kojima je potrebna ekstrakcija teksta, kao što je stvaranje arhiva ili obrada podataka u ravnom tekstu.

 Hrvatski