Bộ chuyển đổi văn bản
Sheetize Text Converter cho .NET cho phép chuyển đổi tài liệu sang và từ định dạng văn bản thẳng, lý tưởng cho việc thu thập dữ liệu, lưu trữ và tích hợp với các hệ thống dựa trên chữ.
Đặc điểm chính
Chuyển đổi tài liệu sang văn bản thẳng
Thu thập nội dung văn bản từ các tài liệu như PDF, DOCX và HTML, hữu ích cho việc xử lý dữ liệu và lưu trữ.
Chuyển đổi văn bản thẳng sang định dạng tài liệu
Tạo các tài liệu định dạng từ văn bản thẳng, cung cấp một cách dễ dàng để tạo ra báo cáo hoặc tệp có cấu trúc.
Hướng dẫn chi tiết
Chuyển đổi tài liệu sang văn bản thẳng
Để chuyển đổi một tài liệu thành văn bản rõ ràng:
- Initialize the Converter : Tạo một ví dụ về
TextConverter
. - Cài đặt tùy chọn chuyển đổi : Sử dụng
DocumentToTextOptions
Cài đặt thiết lập output. - Các bước nhập và xuất định : Cài đặt các bước cho tài liệu đầu vào và tệp văn bản xuất.
- Hãy thực hiện chuyển đổi : Call the
Process
Cách chuyển đổi tài liệu
Ví dụ: Chuyển đổi PDF sang Plain Text
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Bộ chuyển đổi văn bản là điều cần thiết cho các kịch bản mà việc thu thập Văn bản được yêu cầu, chẳng hạn như tạo lưu trữ hoặc xử lý dữ liệu trong văn Bản thẳng.