Bộ Chuyển Đổi Văn Bản
Sheetize Text Converter cho .NET cung cấp một cách đơn giản để chuyển các tệp như PDF, DOCX và HTML sang dạng văn bản thuần và ngược lại, hỗ trợ các trường hợp sử dụng như khai thác dữ liệu, lưu trữ lâu dài và tương tác với các nền tảng chỉ hỗ trợ văn bản.
Tính Năng Chính
Trích Xuất Văn Bản Từ Tài Liệu
Lấy dữ liệu văn bản từ nhiều loại tệp khác nhau, hữu ích cho các quy trình xử lý và mục đích lưu trữ.
Tạo Tài Liệu Từ Văn Bản
Xây dựng các tệp có cấu trúc từ văn bản thô, giúp đơn giản hoá việc tạo báo cáo hoặc đầu ra có định dạng.
Hướng Dẫn Chi Tiết
Chuyển Đổi Tài Liệu Sang Văn Bản Thuần
Các bước để chuyển một tệp sang văn bản thuần:
- Chuẩn Bị Bộ Chuyển Đổi: Chuẩn bị
TextConverter. - Cấu Hình Tùy Chọn: Sử dụng
SaveOptionsđể đặt các tham số chuyển đổi. - Xác Định Đầu Vào/Đầu Ra: Cung cấp vị trí tệp nguồn và tệp đích.
- Chạy Quá Trình: Gọi
Processvới các tùy chọn đã chuẩn bị.
Ví Dụ: Chuyển Đổi PDF Sang Văn Bản
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);Bộ chuyển đổi này rất quan trọng trong các kịch bản yêu cầu trích xuất văn bản thô, chẳng hạn như xây dựng kho lưu trữ có thể tìm kiếm hoặc đưa dữ liệu vào các quy trình làm việc tập trung vào văn bản.