مبدل متن

Sheetize Text Converter برای .NET روشی ساده برای تبدیل فایل‌هایی نظیر PDF، DOCX و HTML به متن ساده و برعکس فراهم می‌کند و موارد استفاده‌ای مثل استخراج داده، ذخیره‌سازی طولانی‌مدت و تعامل با بسترهای متنی صرف را پشتیبانی می‌کند.

ویژگی‌های کلیدی

استخراج متن از اسناد

داده‌های متنی را از انواع فایل‌ها استخراج کنید؛ این قابلیت برای خطوط پردازش داده و مقاصد آرشیوی مفید است.

ایجاد اسناد از متن

فایل‌های ساختاریافته را از متن خام بسازید؛ این کار ساخت گزارش‌ها یا خروجی‌های قالب‌بندی‌شده را ساده می‌کند.


راهنمای جامع

تبدیل یک سند به متن ساده

مراحل تبدیل یک فایل به متن ساده:

  1. آماده‌سازی مبدل: آماده‌سازی TextConverter .
  2. پیکربندی گزینه‌ها: استفاده از SaveOptions برای تعیین پارامترهای تبدیل.
  3. مشخص کردن ورودی/خروجی: مسیرهای منبع و مقصد فایل را فراهم کنید.
  4. اجرای پردازش: فراخوانی Process با گزینه‌های آماده شده.

نمونه: تبدیل PDF به متن

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

این مبدل برای سناریوهایی که نیاز به استخراج متن خام دارند، مانند ساخت آرشیوهای قابل جستجو یا تغذیه داده‌ها به جریان‌های کاری متکی بر متن، حیاتی است.

 فارسی