Text Converter
Sheetize Text Converter cho .NET cho phép chuyển đổi tài liệu sang và từ định dạng văn bản thuần túy, lý tưởng cho việc trích xuất dữ liệu, lưu trữ và tích hợp với hệ thống dựa trên văn bản.
Tính Năng Chính
Chuyển Đổi Tài Liệu Sang Văn Bản Thuần Túy
Trích xuất nội dung văn bản từ các tài liệu như PDF, DOCX và HTML, hữu ích cho việc xử lý dữ liệu và lưu trữ.
Chuyển Đổi Văn Bản Thuần Túy Sang Định Dạng Tài Liệu
Tạo tài liệu định dạng từ văn bản thuần túy, cung cấp một cách dễ dàng để tạo ra các báo cáo hoặc tệp có cấu trúc.
Hướng Dẫn Chi Tiết
Chuyển Đổi Tài Liệu Sang Văn Bản Thuần Túy
Để chuyển đổi một tài liệu sang văn bản thuần túy:
- Khởi Tạo Bộ Chuyển Đổi: Tạo một thể hiện của
TextConverter
. - Cài Đặt Tùy Chọn Chuyển Đổi: Sử dụng
DocumentToTextOptions
để cấu hình cài đặt đầu ra. - Định Nghĩa Đường Dẫn Đầu Vào và Đầu Ra: Đặt đường dẫn cho tài liệu đầu vào và tệp văn bản đầu ra.
- Thực Hiện Chuyển Đổi: Gọi phương thức
Process
để chuyển đổi tài liệu.
Ví dụ: Chuyển Đổi PDF Sang Văn Bản Thuần Túy
// Step 1: Initialize the Text Converter
var converter = new TextConverter();
// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();
// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// Step 4: Execute the conversion
converter.Process(options);
Bộ Chuyển Đổi Văn Bản là cần thiết cho các tình huống cần trích xuất văn bản, chẳng hạn như tạo ra các kho lưu trữ hoặc xử lý dữ liệu dưới dạng văn bản thuần túy.