Bộ Chuyển Đổi Văn Bản

Sheetize Text Converter cho .NET cung cấp một cách đơn giản để chuyển các tệp như PDF, DOCX và HTML sang dạng văn bản thuần và ngược lại, hỗ trợ các trường hợp sử dụng như khai thác dữ liệu, lưu trữ lâu dài và tương tác với các nền tảng chỉ hỗ trợ văn bản.

Tính Năng Chính

Trích Xuất Văn Bản Từ Tài Liệu

Lấy dữ liệu văn bản từ nhiều loại tệp khác nhau, hữu ích cho các quy trình xử lý và mục đích lưu trữ.

Tạo Tài Liệu Từ Văn Bản

Xây dựng các tệp có cấu trúc từ văn bản thô, giúp đơn giản hoá việc tạo báo cáo hoặc đầu ra có định dạng.


Hướng Dẫn Chi Tiết

Chuyển Đổi Tài Liệu Sang Văn Bản Thuần

Các bước để chuyển một tệp sang văn bản thuần:

  1. Chuẩn Bị Bộ Chuyển Đổi: Chuẩn bị TextConverter .
  2. Cấu Hình Tùy Chọn: Sử dụng SaveOptions để đặt các tham số chuyển đổi.
  3. Xác Định Đầu Vào/Đầu Ra: Cung cấp vị trí tệp nguồn và tệp đích.
  4. Chạy Quá Trình: Gọi Process với các tùy chọn đã chuẩn bị.

Ví Dụ: Chuyển Đổi PDF Sang Văn Bản

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

Bộ chuyển đổi này rất quan trọng trong các kịch bản yêu cầu trích xuất văn bản thô, chẳng hạn như xây dựng kho lưu trữ có thể tìm kiếm hoặc đưa dữ liệu vào các quy trình làm việc tập trung vào văn bản.

 Tiếng Việt