مبدل متن
Sheetize Text Converter برای .NET روشی ساده برای تبدیل فایلهایی نظیر PDF، DOCX و HTML به متن ساده و برعکس فراهم میکند و موارد استفادهای مثل استخراج داده، ذخیرهسازی طولانیمدت و تعامل با بسترهای متنی صرف را پشتیبانی میکند.
ویژگیهای کلیدی
استخراج متن از اسناد
دادههای متنی را از انواع فایلها استخراج کنید؛ این قابلیت برای خطوط پردازش داده و مقاصد آرشیوی مفید است.
ایجاد اسناد از متن
فایلهای ساختاریافته را از متن خام بسازید؛ این کار ساخت گزارشها یا خروجیهای قالببندیشده را ساده میکند.
راهنمای جامع
تبدیل یک سند به متن ساده
مراحل تبدیل یک فایل به متن ساده:
- آمادهسازی مبدل: آمادهسازی
TextConverter. - پیکربندی گزینهها: استفاده از
SaveOptionsبرای تعیین پارامترهای تبدیل. - مشخص کردن ورودی/خروجی: مسیرهای منبع و مقصد فایل را فراهم کنید.
- اجرای پردازش: فراخوانی
Processبا گزینههای آماده شده.
نمونه: تبدیل PDF به متن
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);این مبدل برای سناریوهایی که نیاز به استخراج متن خام دارند، مانند ساخت آرشیوهای قابل جستجو یا تغذیه دادهها به جریانهای کاری متکی بر متن، حیاتی است.