Μετατροπέας Κειμένου
Το Sheetize Text Converter για .NET παρέχει έναν απλό τρόπο για τη μετατροπή αρχείων όπως PDF, DOCX και HTML σε απλό κείμενο και αντίστροφα, υποστηρίζοντας περιπτώσεις χρήσης όπως εξόρυξη δεδομένων, μακροπρόθεσμη αποθήκευση και αλληλεπίδραση με πλατφόρμες που υποστηρίζουν μόνο κείμενο.
Κύρια Χαρακτηριστικά
Εξαγωγή Κειμένου από Έγγραφα
Ανάκτηση κειμένου από διάφορους τύπους αρχείων, χρήσιμο για pipelines επεξεργασίας και αρχειοθέτηση.
Δημιουργία Εγγράφων από Κείμενο
Δημιουργία δομημένων αρχείων από ακατέργαστο κείμενο, απλοποιώντας τη σύνταξη αναφορών ή μορφοποιημένων εξόδων.
Λεπτομερής Οδηγός
Μετατροπή Εγγράφου σε Απλό Κείμενο
Βήματα για τη μετατροπή ενός αρχείου σε απλό κείμενο:
- Προετοιμασία του Μετατροπέα: Προετοιμάστε το
TextConverter. - Διαμόρφωση Επιλογών: Χρησιμοποιήστε το
SaveOptionsγια να ορίσετε τις παραμέτρους μετατροπής. - Καθορισμός Εισόδου/Εξόδου: Δώστε τις θέσεις των πηγαίων και προοριστικών αρχείων.
- Εκτέλεση της Διαδικασίας: Καλέστε το
Processμε τις προετοιμασμένες επιλογές.
Παράδειγμα: Μετατροπή PDF σε Κείμενο
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Ο μετατροπέας είναι σημαντικός για σενάρια που απαιτούν εξαγωγή ακατέργαστου κειμένου, όπως η δημιουργία αρχειοθέτησης με δυνατότητα αναζήτησης ή η τροφοδότηση δεδομένων σε ροές εργασίας που εστιάζουν στο κείμενο.